标签: 正则表达式
11 个内容
笔记(11)
本文针对正则表达式中词边界`\b`在处理中英文混排时失效的问题,提出了使用Unicode属性和环视(lookaround)的解决方案。针对JavaScript、Python和Go等常见语言,分别给出了使用建议和规避方案,并提供了多个典型用例。核心是CJK场景下避免依赖`\b`,利用环视和Unicode属性类实现更精确的匹配。
本文总结了JavaScript中使用`new RegExp()`的注意事项与安全转义方法。针对动态生成正则时出现的转义问题和安全风险,提出了使用`escapeRegExp`函数对用户输入进行转义的方案,并封装了`makeSafeRegex`函数以支持更安全的正则构造,同时避免替换中的特殊字符被转义。
Unicode字符类正则表达式`[\\pP\\pS\\pZ]`用于匹配标点符号(\pP)、符号(\pS)和分隔符(\pZ)。常用于文本清理、数据预处理、格式验证和分词处理,可匹配中英文标点、数学符号、货币符号及空格等,适用于处理多语言文本中的非字母数字字符。
本文介绍了如何使用 JavaScript 正则表达式将 LaTeX 公式 `\(...\)` 和 `\[...\]` 转换为 Markdown 格式 `$…$` 和 `$$…$$`,以方便在 Markdown 编辑器中渲染。核心代码通过正则表达式匹配并替换公式内容,并去除多余空格。该方法适用于多种文本编辑器和文档工具。
本文档为正则表达式速查表,旨在提供常用的正则表达式语法和标志位参考。内容包括字符类、锚点、转义字符、分组与断言、量词与替换等。同时提供了常见用法示例,例如去除字符串首尾空格。
本文记录了作者开发中遇到的一些问题及解决方案。包括:node-fetch header值包含换行符错误;正则表达式兼容性问题;Jetbrains字体行高设置;Preview Tab使用习惯调整;graphql-code-generator 类型错误;.tsx文件中泛型箭头函数使用;Mac CapsLock切换输入法延迟;Git文件大小写敏感设置;GitHub Pages history mode;event.path未定义等问题,并提供了相应的解决办法或兼容方案。