XPath 2.0 的 for、if、in 均为表达式而非语句,必须嵌入合法上下文;for 需 return 构造序列,if 必须带 else 且类型一致,in 仅用于成员判断且右操作数须为序列。

XPath 2.0的for, if, in表达式怎么用  第1张

XPath 2.0 的 forifin 不是独立语句,而是表达式的一部分,必须嵌入在合法的 XPath 表达式上下文中(比如路径结尾、函数参数里),不能单独执行。

for 表达式:怎么写循环并拼接结果

for 是一个序列映射构造器,类似函数式语言的 map,不是传统 for 循环。它必须配合 return 子句,且整个表达式返回一个序列。

  • 语法结构固定:for $x in $seq return $x * 2$x 是绑定变量,$seq 必须是可迭代序列(如节点集、数字列表)
  • 常见错误:漏写 return → 报错 XPDY0002(unexpected token "in")
  • 不能修改外部变量,也不支持 break/continue
  • 典型用途:批量计算属性值、生成新节点序列、转换文本列表
for $i in (1, 2, 3) return $i * 10

结果是序列:(10, 20, 30)

if 表达式:必须带 else,且类型要一致

if 是三元表达式,不是控制语句。XPath 2.0 要求必须有 else 分支,否则语法错误(XPST0003)。

  • 条件部分必须是布尔值或可转为布尔的序列(空序列→false(),非空→true()
  • thenelse 返回值类型最好一致;若不一致(如一个返回字符串、一个返回数字),XPath 引擎可能隐式转换,也可能报错(取决于实现)
  • 不能只用于“副作用”,比如 if (@type = 'email') then xdmp:log('found') 在标准 XPath 中无效——xdmp:log 是 MarkLogic 扩展,纯 XPath 2.0 没有副作用函数
if (@price > 100) then 'expensive' else 'affordable'

in 运算符:只用于成员判断,不是 for 的一部分

in 是二元运算符,用于测试单个项是否属于某个序列,和 Python 的 in 类似,但**不能**出现在 for $x in ... 之外的任意位置作逻辑判断(比如不能写 @id in ('a', 'b') 当作谓词直接用——这是合法的;但不能写 if (@id in 'a') then ...,因为右边不是序列)。

  • 左边必须是单个原子值(如字符串、数字),右边必须是原子值序列
  • 常见误用:@status in 'active' → 错,'active' 是字符串,不是序列;应写成 @status = 'active'@status in ('active')
  • 等价但更常用的是 =(自动集合比较),in 更适合明确枚举多个候选值
@role in ('admin', 'editor', 'reviewer')

组合使用:for + if + in 的典型场景

真正实用的写法往往是嵌套组合,比如过滤后映射:

  • 先用 for 遍历节点,再在 return 里用 if 分支处理,其中条件可能含 in
  • 注意括号优先级:for $n in //item return if ($n/@cat in ('book', 'mag')) then $n/title else ()
  • 返回空序列 () 表示跳过该节点,最终结果只含匹配项的 title
  • 性能提示:避免在 for 内部重复执行耗时路径(如 //config/value),应提前绑定到变量
for $u in /users/user
return if ($u/role in ('vip', 'staff'))
       then concat('VIP-', $u/id)
       else $u/name

最容易被忽略的是:所有这些表达式都运行在静态上下文里,没有变量赋值、没有状态、不能递归调用自身——它们只是对输入序列的一次性、无副作用的函数式变换。写之前先确认你的处理器(如 Saxon、BaseX、浏览器 DOM)确实支持 XPath 2.0;多数浏览器仅支持 XPath 1.0,for/if/in 会直接报语法错误。