对于大多数字符串,您需要允许转义 任何内容 (而不仅仅是转义引号)。例如,你很可能需要允许转义字符像"\n"
和"\t"
当然,转义逃逸:"\\"
。
这是您要查找的正则表达式:
"([^"\\]|\\.)*"
版本1:工作正常,但效率不高。
"([^"\\]++|\\.)*"
或"((?>[^"\\]+)|\\.)*"
版本2:如果您拥有所有格限定词或原子组,则效率更高(请参阅:使用原子组方法的sin的正确答案)。
"[^"\\]*(?:\\.[^"\\]*)*"
版本3:效率更高。实现Friedl的 “展开循环” 技术。不需要所有格或原子组(即可以在Javascript和其他功能较少的正则表达式引擎中使用。)
这是PHP语法中针对双引号和单引号子字符串的推荐正则表达式:
$re_dq = '/"[^"\\\\]*(?:\\\\.[^"\\\\]*)*"/s';
$re_sq = "/'[^'\\\\]*(?:\\\\.[^'\\\\]*)*'/s";