
语言检测是我们在过去的项目中需要的功能。 我在 2020 年写了一篇关于 Optimaize Language Detector java 库的 kju2 fork 的使用的文章。自 2015 年以来,Optimaize 库就没有更新过,kju2 分支于 2023 年 4 月 16 日被置于只读模式。
我评估了 Lingua java 库。它声称是“Java 和 JVM 最准确的自然语言检测库,适用于长文本和短文本”,并且似乎也在积极更新和支持。 在我的小单元测试中,Lingua 似乎稍微慢一些,并且无法正确识别马来语文本。
对于英语来说,两个 java 库的检测时间都是相当随机的。有时它会在 295 毫秒内返回响应,有时则需要 48,000 毫秒以上。 (也许这只是我的开发电脑。)平均而言,kju2 似乎更快。
我还发现了一个第三方检测语言API,支持165种语言,并声称具有“高精度”。它需要 API 密钥,并提供免费和高级计划。
云雀语言模型
云雀是一款由字节跳动研发的语言模型,通过便捷的自然语言交互,能够高效的完成互动对话
54 查看详情
立即学习“Java免费学习笔记(深入)”;
如果您使用 Java 和/或 ColdFusion/CFML 执行语言检测,您使用什么?
ENGLISHENGLISH2272ENGLISH570en537A great way to learn Spanish vocabulary is by reading texts, stories or articles that are completely in the language. That is why we have written are own short reading passages in Spanish about different topics.GREEKGREEK6GREEK12el105Βίβλος γενέσεως Ἰησοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀβραάμ.FRENCHFRENCH61FRENCH78fr70En hiver, il fait froid en France. Le soleil se lève tard. Il fait encore nuit quand je vais au travail. Parfois, il y a même de la neige.HEBREWHEBREW3HEBREW11iw110כל ישראל יש להם חלק לעולם הבא, שנאמר ועמך כולם צדיקים, לעולם יירשו ארץ, נצר מטעי מעשה ידי להתפאר.ARABICARABIC2ARABIC19ar81عندما يريد العالم أن يتكلّم ، فهو يتحدّث بلغة يونيكود. تسجّل الآن لحضور المؤتمر الدولي العاشر ليونيكودCHINESECHINESE2CHINESE8zh74虽然它长得不好看,但是它有一颗无比善良的心。小猴子乐乐的家被大水冲垮了,无家可归。丑丑就让乐乐住在自己的家,还把自己最喜欢吃的巧克力分给乐乐吃。不仅如此,谁头痛、生病了,没钱买药,它都会尽其所能进行帮助。KOREANKOREAN12KOREAN3ko120안녕하십니까 할리데이비슨 대구점 MC 우제헌입니다. 포티에잇 문의 전달받고 전화 드렸습니다만 연결되지 않아 문자 드립니다.SPANISHSPANISH0SPANISH116es92Habitualmente este término se aplica a todas las pistas donde aterrizan aviones, sin embargo el término correcto es aeródromo.THAITHAI1THAI14th105ข้อ 1 มนุษย์ทั้งหลายเกิดมามีอิสระและเสมอภาคกันในเกียรติศักด[เกียรติศักดิ์]และสิทธิ ต่างมีเหตุผลและมโนธรรม และควรปฏิบัติต่อกันด้วยเจตนารมณ์แห่งภราดรภาพVIETNAMESEVIETNAMESE2VIETNAMESE14vi98Tất cả mọi người sinh ra đều được tự do và bình đẳng về nhân phẩm và quyền lợi. Mọi con người đều được tạo hóa ban cho lý trí và lương tâm và cần phải đối xử với nhau trong tình anh em.TURKISHTURKISH3TURKISH93tr212Yukarda mavi gök, asağıda yağız yer yaratıldıkta; ikisinin arasında insan oğlu yaratılmış. İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak Türk milletinin ülkesini, türesini, idare edivermiş, tanzim edivermis. Dört taraf hep düşman imiş. Asker sevk edip dört taraftaki kavmi hep (itaati altına) almış hep muti kılmış. Başlılara baş eğdirmiş, dizlilere diz çöktürmüş.JAPANESEJAPANESE3JAPANESE7ja194幸運こううんにも、息子むすこはこの四月しがつから保育園ほいくえんに入はいることができ、私わたしはまた働はたらき始はじめた。RUSSIANRUSSIAN2RUSSIAN1393ru96Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны поступать в отношении друг друга в духе братства.FINNISHFINNISH6FINNISH383fi125Jokaisella on oikeus saada opetusta. Opetuksen on oltava ainakin alkeis- ja perusopetuksen osalta maksutonta. Alkeisopetuksen on oltava pakollinen. Teknistä ja ammattiopetusta on oltava yleisesti saatavilla, ja korkeamman opetuksen on oltava avoinna yhtäläisesti kaikille heidän kykyjensä mukaan.URDUURDU1URDU22ur104ایک ملک پر سخت گیر بادشاہ حکومت کرتا تھا۔وہ رعایا پر طرح طرح کے ٹیکس عائد کرتا اور ٹیکس کے پیسے دوسرے ممالک میں جاکر فضولیات میں ضائع کرتا۔THAITHAI1THAI2th78Hello World สวัสดีชาวโลกMALAYMALAY2UNKNOWN291id88Pesan moral dari Cerita Rakyat Bawang Merah Bawang Putih adalah Jangan terlalu tamak dan serakah. Setiap orang sudah memiliki rezekinya masing-masing. Orang yang terlalu serakah akan mendapatkan balasan yang setimpal dengan perbuatannya. Selalu berbuat baik lah dalam setiap tingkah laku, maka kita akan mendapatkan kebaikan dan kebahagiaan.
源代码
https://gist.github.com/JamoCA/b883fbddf0303df8f4b0d597cfc2ae25
以上就是使用 Java/ColdFusion/CFML 比较语言检测库(和 API)的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/479968.html
微信扫一扫
支付宝扫一扫