Go语言中按符文(Rune)遍历字符串的正确姿势

Go语言中按符文(Rune)遍历字符串的正确姿势

go语言中的字符串是utf-8编码字节序列,直接通过索引访问会得到字节而非unicode符文。要正确地按符文(即unicode代码点)遍历字符串,应使用`for…range`循环。该循环会自动解析utf-8编码,每次迭代提供符文的起始字节位置和对应的`rune`类型值,从而确保对多字节字符的正确处理。

在Go语言中,字符串本质上是只读的字节切片([]byte)。这意味着当我们尝试通过传统的索引方式,例如str[i],来访问字符串的元素时,我们获取到的是一个byte类型的值(uint8),而不是一个Unicode符文(rune)。对于只包含ASCII字符的字符串,这可能不会立即引发问题,因为每个ASCII字符都只占用一个字节。然而,当字符串包含多字节的UTF-8编码字符(如中文、日文等)时,直接的字节索引将无法正确识别单个字符,可能导致乱码或逻辑错误。

理解Go语言字符串与符文

字符串(string): Go语言的字符串是不可变的字节序列,通常以UTF-8编码存储。len(str)返回的是字符串的字节长度,而非字符(符文)数量。符文(rune): rune是Go语言中int32的别名,用于表示一个Unicode代码点。一个符文可能由一个或多个字节组成。

错误的遍历方式

尝试通过字节索引来遍历字符串并期望得到符文是一种常见的误解:

package mainimport "fmt"func main() {    str := "你好world"    // 这种方式是错误的,str[i]返回的是byte    for i := 0; i < len(str); i++ {        // fmt.Printf("byte at index %d: %c\n", i, str[i]) // str[i]是byte,直接打印%c可能不正确        fmt.Printf("byte at index %d: %X\n", i, str[i]) // 打印字节的十六进制值    }}

运行上述代码,你会发现对于“你好”这样的多字节字符,它会打印出多个字节,而不是单个字符。例如,“你”在UTF-8中由三个字节组成。

正确的符文遍历方式:使用 for…range 循环

Go语言提供了一种专门用于处理Unicode字符串的简洁而强大的机制,即在字符串上使用for…range循环。当for…range循环用于字符串时,它会智能地解析UTF-8编码,每次迭代返回两个值:

立即学习“go语言免费学习笔记(深入)”;

ImagetoCartoon ImagetoCartoon

一款在线AI漫画家,可以将人脸转换成卡通或动漫风格的图像。

ImagetoCartoon 106 查看详情 ImagetoCartoon pos: 当前符文在原始字符串中的起始字节位置。char: 当前的Unicode符文,类型为rune。

以下是正确遍历字符串并处理符文的示例:

package mainimport "fmt"func main() {    s := "日本語" // 包含多字节UTF-8字符的字符串    fmt.Println("使用 for...range 遍历字符串:")    for pos, char := range s {        fmt.Printf("字符 '%c' (rune: %U) 始于字节位置 %d\n", char, char, pos)    }    fmt.Println("\n使用 for...range 遍历包含英文和数字的字符串:")    s2 := "Hello, Go! 123"    for pos, char := range s2 {        fmt.Printf("字符 '%c' (rune: %U) 始于字节位置 %d\n", char, char, pos)    }}

运行上述代码,你将得到如下输出:

使用 for...range 遍历字符串:字符 '日' (rune: U+65E5) 始于字节位置 0字符 '本' (rune: U+672C) 始于字节位置 3字符 '語' (rune: U+8A9E) 始于字节位置 6使用 for...range 遍历包含英文和数字的字符串:字符 'H' (rune: U+48) 始于字节位置 0字符 'e' (rune: U+65) 始于字节位置 1字符 'l' (rune: U+6C) 始于字节位置 2字符 'l' (rune: U+6C) 始于字节位置 3字符 'o' (rune: U+6F) 始于字节位置 4字符 ',' (rune: U+2C) 始于字节位置 5字符 ' ' (rune: U+20) 始于字节位置 6字符 'G' (rune: U+47) 始于字节位置 7字符 'o' (rune: U+6F) 始于字节位置 8字符 '!' (rune: U+21) 始于字节位置 9字符 ' ' (rune: U+20) 始于字节位置 10字符 '1' (rune: U+31) 始于字节位置 11字符 '2' (rune: U+32) 始于字节位置 12字符 '3' (rune: U+33) 始于字节位置 13

从输出可以看出,对于“日本語”这样的字符串,range循环正确地识别了每个字符,并给出了它们在字节序列中的起始位置。例如,“日”是第一个字符,从字节位置0开始;“本”是第二个字符,但它从字节位置3开始,这表明“日”占据了3个字节。对于单字节的ASCII字符,pos会按1递增。

注意事项

符文计数: len(str)返回的是字节数,而不是符文数。要获取字符串中的符文数量,可以使用unicode/utf8包中的utf8.RuneCountInString(str)函数。字符串修改: Go语言的字符串是不可变的。如果需要修改字符串内容,通常需要将其转换为[]rune或[]byte,进行修改后再转换回string。手动解码: 在极少数需要更底层控制的场景下,可以使用unicode/utf8包中的utf8.DecodeRuneInString或utf8.DecodeRune函数手动解码UTF-8字节序列。但对于简单的符文遍历,for…range是首选且最安全的方式。

总结

在Go语言中,处理包含Unicode字符的字符串时,始终建议使用for…range循环来按符文进行迭代。这种方式不仅代码简洁,而且能够正确处理UTF-8编码的多字节字符,避免了直接字节索引可能导致的错误和复杂性。理解字符串是字节序列,而rune是Unicode代码点的概念,是编写健壮Go程序的基础。

以上就是Go语言中按符文(Rune)遍历字符串的正确姿势的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1087808.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月2日 10:06:40
下一篇 2025年12月2日 10:07:02

相关推荐

  • HiDream-I1— 智象未来开源的文生图模型

    hidream-i1:一款强大的开源图像生成模型 HiDream-I1是由HiDream.ai团队开发的17亿参数开源图像生成模型,采用MIT许可证,在图像质量和对提示词的理解方面表现卓越。它支持多种风格,包括写实、卡通和艺术风格,广泛应用于艺术创作、商业设计、科研教育以及娱乐媒体等领域。 HiDr…

    2025年12月5日
    000
  • 如何在Laravel中集成支付网关

    在laravel中集成支付网关的核心步骤包括:1.根据业务需求选择合适的支付网关,如stripe、paypal或支付宝等;2.通过composer安装对应的sdk或laravel包,如stripe/stripe-php或yansongda/pay;3.在.env文件和config/services.…

    2025年12月5日
    300
  • js如何实现剪贴板历史 js剪贴板历史管理的4种技术方案

    要实现js剪贴板历史,核心在于拦截复制事件、存储复制内容并展示历史记录。1. 使用document.addeventlistener(‘copy’)监听复制事件,并通过e.clipboarddata.getdata获取内容;2. 用localstorage或indexeddb…

    2025年12月5日 web前端
    100
  • 喜茶微信点单怎么用抖音券:详细教程及优惠攻略

    【引言】 作为新式茶饮的领军品牌,喜茶凭借其高品质原料与持续创新的产品赢得了广大消费者的喜爱。为提升服务效率与用户体验,喜茶全面上线了微信小程序点单功能,让用户无需排队即可完成下单。与此同时,喜茶携手抖音平台推出专属优惠活动——抖音券,进一步降低消费门槛。本文将为您全面解析如何在喜茶微信点单时使用抖…

    2025年12月5日
    000
  • 如何在Laravel中实现缓存机制

    laravel的缓存机制用于提升应用性能,通过存储耗时操作结果避免重复计算。1. 配置缓存驱动:在.env文件中设置cache_driver,如redis,并安装相应扩展;2. 使用cache facade进行缓存操作,包括put、get、has、forget等方法;3. 使用remember和pu…

    2025年12月5日
    000
  • Java中Executors类的用途 掌握线程池工厂的创建方法

    如何使用executors创建线程池?1.使用newfixedthreadpool(int nthreads)创建固定大小的线程池;2.使用newcachedthreadpool()创建可缓存线程池;3.使用newsinglethreadexecutor()创建单线程线程池;4.使用newsched…

    2025年12月5日 java
    000
  • js如何解析XML格式数据 处理XML数据的4种常用方法!

    在javascript中解析xml数据主要有四种方式:原生domparser、xmlhttprequest、第三方库(如jquery)以及fetch api配合domparser。使用domparser时,创建实例并调用parsefromstring方法解析xml字符串,返回document对象以便…

    2025年12月5日 web前端
    100
  • 解决WordPress博客首页无法显示页面标题的问题

    摘要:本文针对WordPress主题开发中,使用静态页面作为博客首页时,home.php无法正确显示页面标题的问题,提供了详细的解决方案。通过使用get_the_title()函数并结合get_option(‘page_for_posts’)获取文章页面的ID,从而正确显示博…

    2025年12月5日
    000
  • 如何在Laravel中处理表单提交

    在laravel中处理表单提交的步骤如下:1. 创建包含正确method、action属性和@csrf指令的html表单;2. 在routes/web.php或routes/api.php中定义路由,如route::post(‘/your-route’, ‘you…

    2025年12月5日
    100
  • 什么是抖音LIVE礼物以及它们如何运作?抖音LIVE

    抖音LIVEGifts是抖音上的一项便捷功能,可让观看者对您的视频做出反应,表达对您努力的赞赏。这是新兴抖音用户在平台上赚钱的更流行的方式之一,并有助于流行的抖音表演者现在可以从他们的内容中获得健康的收入。如果您想知道可以从抖音帐户中赚多少钱,请使用我们的奖金抖音影响者收入估算器查看抖音ers赚多少…

    2025年12月5日
    000
  • WordPress博客首页无法显示页面标题的解决方案

    本教程旨在解决WordPress主题开发中,使用静态首页和博客页面展示最新文章时,home.php无法正确获取页面标题和特色图像的问题。通过使用get_the_title()函数并结合get_option(‘page_for_posts’)获取博客页面的ID,可以确保博客首页…

    2025年12月5日
    000
  • 126邮箱官网登录入口网页版 126邮箱登录首页官网

    126邮箱官网登录入口网页版为https://mail.126.com,用户可通过邮箱账号或手机号快速注册登录,支持密码找回、扫码验证;页面适配多设备,具备分栏式收件箱、邮件筛选、批量操作及星标分类功能;附件上传下载支持实时进度与断点续传,兼容多种文件格式预览。 126邮箱官网登录入口网页版在哪里?…

    2025年12月5日
    000
  • 曝小米已终止澎湃OS 2全部开发工作!聚焦澎湃OS 3

    CNMO从海外媒体获悉,小米已全面停止对澎湃OS 2的所有开发进程,集中力量推进下一代操作系统——澎湃OS 3的开发与发布准备。 据最新消息,澎湃OS 3有望于今年8月或9月正式亮相。初步资料显示,新系统将重点提升用户界面的精致度、系统动画的流畅性以及整体运行性能。小米方面强调,将确保现有设备用户能…

    2025年12月5日
    000
  • js怎样实现粒子动画效果 炫酷粒子动画的3种实现方式

    实现炫酷的粒子动画可通过以下三种方式:1. 使用 canvas 实现基础 2d 粒子动画,通过创建 canvas 元素、定义粒子类、使用 requestanimationframe 创建动画循环来不断更新和绘制粒子;2. 使用 three.js 实现 3d 粒子动画,借助 webgl 渲染器、场景、…

    2025年12月5日 web前端
    000
  • AI 赋能云电脑智变升级 中兴通讯助力中国移动共绘端云算网新生态

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 2025中国移动云智算大会在苏州举行,中兴通讯与中国移动携手展示基于AI技术的云电脑创新成果,彰显双方在智能算力领域的深度合作。 大会集中展示了涵盖训练及推理集群、智算网络和智慧终端的全场景智算…

    2025年12月5日
    000
  • Java中MANIFEST.MF的作用 详解清单文件

    manifest.mf是java中jar文件的元数据配置文件,位于meta-inf目录下,用于定义版本、主类、依赖路径等关键信息。1. 它允许指定入口类,使jar可直接运行;2. 通过class-path管理依赖,减少类加载冲突;3. 可配置安全权限,如设置沙箱运行;4. 常见属性包括manifes…

    2025年12月5日 java
    000
  • OPPO Find X9系列新机首发ColorOS 16 10月16日发布

    10月14日,oppo正式宣布:find x9系列将全球首个搭载全新coloros 16操作系统。该系统在ai智能记录、跨平台互联以及便捷传输等功能上实现全方位进化。 OPPO Find X9 据CNMO消息,ColorOS 16全新推出的“AI一键闪记”功能,支持视频、账单、图片及语音内容的快速捕…

    2025年12月5日
    000
  • 直播带货新玩法揭秘 + AI 无人直播技术赋能:零压力实现收益翻倍

    ai无人直播不能完全取代真人主播,而是作为补充和延伸;2. 它通过虚拟数字人结合nlp、cv、tts、asr和推荐算法等ai技术实现自动化直播;3. 核心优势在于24小时不间断运营、降低人力成本、提升转化效率;4. 可应用于答疑、长尾商品销售、非高峰时段引流等场景;5. 需与真人直播协同,通过数据反…

    2025年12月5日
    000
  • 8999 起?荣耀 Magic6 至臻版 / 保时捷设计今晚发布

    今晚将举行荣耀春季旗舰新品发布会,预计会推出荣耀 magic6 至臻版、荣耀 magic6 rsr 保时捷设计和荣耀首款 ai pc 荣耀 magicbook pro 16 三款新品。目前,官方主要对 magic6 至臻版和 magicbook pro 16 进行了预热,而荣耀 magic 6 rs…

    2025年12月5日 硬件教程
    000
  • AYANEO官宣NEXT 2掌机项目:锐龙AI Max+395处理器+内置电池

    在昨日(7月28日)举行的2025-2026战略分享会上,AYANEO正式公布了其全新旗舰掌机项目——AYANEO NEXT 2。该设备将搭载基于锐龙AI Max+395“Strix Halo”平台的高性能芯片,定位为次世代掌上游戏主机。 与近期GPD发布的可拆卸电池设计的WIN 5不同,AYANE…

    2025年12月5日 行业动态
    000

发表回复

登录后才能评论
关注微信