推荐使用mb_substr()处理中文字符截取,如mb_substr(“你好世界”, 0, 2, ‘UTF-8’)输出“你好”;2. 单字节字符可用substr(),如substr(“Hello World”, 0, 5)输出“Hello”;3. 复杂场景可用正则preg_match(‘/^.{1,4}/u’, “今天天气真好啊”, $m)提取“今天天气”;4. 可封装兼容函数优先调用mb_substr(),无mbstring时降级使用substr(),确保环境兼容。

PHP中截取字符串有多种方式,主要根据字符编码和具体需求选择合适的方法。以下是几种常用且实用的字符串截取方式。
1. substr() 函数(适用于单字节字符)
substr() 是 PHP 内置函数,用于按字节位置截取字符串。它适合处理英文或 ASCII 字符,但在处理中文等多字节字符时容易出现乱码。
语法:
substr(string $string, int $start, ?int $length = null)
示例:
$str = “Hello World”;
echo substr($str, 0, 5); // 输出:Hello
注意:
如果字符串包含中文,使用 substr() 可能会截断汉字导致乱码,比如:
立即学习“PHP免费学习笔记(深入)”;
$str = “你好世界”;
echo substr($str, 0, 3); // 可能输出乱码,因为一个中文通常占3字节
2. mb_substr() 函数(推荐用于多字节字符)
处理中文、日文等多字节字符时,应使用 mb_substr(),它是多字节安全的函数,能正确按“字符”截取。
前提:
确保服务器启用了 mbstring 扩展。
语法:
mb_substr(string $str, int $start, ?int $length = null, ?string $encoding = null)
示例:
$str = “你好世界”;
echo mb_substr($str, 0, 2, ‘UTF-8’); // 输出:你好
说明:第四个参数指定编码,常用 ‘UTF-8’ 如果不写编码,依赖 php.ini 的设置,建议显式指定
3. 使用正则表达式截取(灵活匹配)
当需要根据特定模式提取内容时,可用 preg_match() 或 preg_replace() 配合正则表达式。
示例:提取前4个中文字符
$str = “今天天气真好啊”;
preg_match(‘/^.{1,4}/u’, $str, $matches);
echo $matches[0]; // 输出:今天天气
说明:’u’ 修饰符表示启用 UTF-8 模式 适合复杂场景,如按词、标点或规则截取
4. 自定义函数实现安全截取
为避免不同环境下的编码问题,可以封装一个通用截取函数。
示例:
function cutStr($str, $start, $length) {
if (function_exists(‘mb_substr’)) {
return mb_substr($str, $start, $length, ‘UTF-8’);
} else {
return substr($str, $start, $length);
}
}
优点:
兼容性好,在没有 mbstring 扩展时降级使用 substr。
基本上就这些。日常开发中,只要涉及中文,优先使用 mb_substr(),并明确指定编码,可避免绝大多数问题。简单英文场景用 substr 也没问题。关键是根据项目编码环境选择合适方法。不复杂但容易忽略。
以上就是php字符串的截取方式的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1339571.html
微信扫一扫
支付宝扫一扫