
最近,我尝试了John Crickett的编码挑战,并决定分享我的经验。第一个挑战是使用PHP重写经典的Unix工具wc(单词计数器)。虽然我自1997年以来就一直使用Linux,但wc并非我常用的工具,因此我决定深入研究一下。
我最初的想法是用文本编辑器直接编写代码,使用Vim在SSH连接下,平板电脑作为终端,甚至不使用键盘。我选择了PHP作为我的开发语言,认为这应该很简单。结果证明,这是一个糟糕的主意,代码混乱不堪,我将其保留在GitHub仓库中作为警示。
在添加蓝牙键盘并将Vim配置成更像IDE之后,我进行了第二次尝试。这次,我的目标是:
面向对象编程测试驱动开发支持任意大的文件尽可能模拟coreutils wc的行为具有良好的性能
以下是我的主要收获:
立即学习“PHP免费学习笔记(深入)”;
挑战与解决方案:
多字节字符支持: 一个成熟的Unix工具理应支持多字节字符。PHP的mb_strlen函数解决了这个问题。
大文件支持: wc可能需要处理超过系统内存的文件。我需要分块读取文件,避免使用file_get_contents。 处理跨越块边界的单词也需要特殊考虑。
标准输入: 程序需要能够从标准输入(管道和重定向)读取数据。这需要使用流处理。
开发环境的重要性:
我放弃了平时使用的PHPStorm,转而使用一个简单的文本编辑器。这让我意识到IDE提供的自动化功能以及我对此的依赖程度。我尤其怀念代码补全和重构工具。
缺乏重构工具显著增加了我的认知负担,使编程过程变得笨拙。我不得不记住PHP内置函数的参数顺序以及自己代码的结构。这降低了我的开发速度。
我发现缺乏重构工具阻碍了迭代开发。进行代码结构调整变得非常费力,我经常选择保留最初的错误设计,而不是进行修改。
建议:
使用IDE或功能强大的编辑器,至少具备代码补全和代码导航功能。自动化测试至关重要。黑盒测试可以验证程序行为,允许进行无风险的重构。
在第二次尝试中,我进行了大量的测试驱动开发,这极大地提高了我的开发速度和信心。
代码示例:
我最初的count方法:
if ($countmode === countmode::character) { return strlen($contents);}// ... other cases ...
改进后的count方法,使用匹配表达式:
return match($countMode) { CountMode::CHARACTER => strlen($contents), CountMode::MB_CHARACTER => mb_strlen($contents), CountMode::LINE => count(preg_split('(rn|r|n)', $contents)) - 1, CountMode::WORD => static::countWords($contents)};
其他收获:
生成器函数非常强大且易于使用。页面大小对文件加载性能至关重要。枚举类型非常有用。箭头函数无法修改其父作用域中的标量变量。
总而言之,这是一个很有挑战性的经历,让我学到了很多东西。我的完整解决方案已上传至GitHub。
以上就是我在php中建造了`wc’的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1252784.html
微信扫一扫
支付宝扫一扫