模型

  • GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了

    首个ai软件工程师devin正式亮相,立即引爆了整个技术界。 Devin虽然不能够轻松解决编码任务,但可以自主完成软件开发的整个周期——从项目规划到部署。他尽力挖掘,但不限于构建网站、自主寻找并修复BUG、培训和微调AI模型等。 这种 “强到逆天” 的软件开发能力,让一众码农纷纷绝望,直呼:“程序员…

    2025年12月1日 科技
    000
  • 0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

    澜舟科技官宣:孟子3-13b大模型正式开源! 这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。 在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。 尤其在参量20B以内的轻量化大模型领域,中英文语言能力方面尤为突出。数学和编程能…

    2025年12月1日 科技
    000
  • 谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择

    谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow,7项指标排名第一。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 而且测试并不是在JAX性能表现最好的TPU上完成的。 虽然现在在开发者中,Pytorch依…

    2025年12月1日 科技
    000
  • 5倍于ChatGPT Intel推出Aurora genAI大模型:1万亿参数

    这几个月来chatgpt很火,带动各大科技巨头都要下场研发自己的ai大模型,现在intel也加入战局,推出aurora genai模型,参数量高达1万亿。 目前ChatGPT 3.5模型的参数规模说是1750亿,意味着Aurora genAI模型至少是它的5倍,目前有不少公司都宣传自家的模型是万亿参…

    2025年12月1日 科技
    000
  • 大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

    还记得前几天发布的DragGAN吗? 没错,就是那个「轻轻点两下」1秒修图的工具。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 拍的照片表情不好?修!脸型不够瘦?修!脸冲镜头的角度不对?修! 搞不好,「让大象转个身」这个远古PS段子,可能…

    2025年12月1日 科技
    000
  • AI模仿人脑记忆模式,游戏成绩大涨29.9%

    我们常常被教育的做事“三思而后行”,充分运用积累过的经验,现在这句话对%ign%ignore_a_1%re_a_1%也有所启发了。 传统的决策AI模型由于遗忘效应的存在不能有效积累经验,但一项由华人主导的研究改变了AI的记忆方式。 新的记忆方式模仿了人类大脑,有效地提高了AI积累经验的效率,从而将A…

    2025年12月1日 科技
    000
  • 500万token巨兽,一次读完全套「哈利波特」!比ChatGPT长1000多倍

    记性差是目前主流大型语言模型的主要痛点,比如ChatGPT只能输入4096个token(约3000个词),经常聊着聊着就忘了之前说什么了,甚至都不够读一篇短篇小说的。 过短的输入窗口也限制了语言模型的应用场景,比如给一篇科技论文(约1万词)做摘要的时候,需要把文章手动切分后再输入到模型中,不同章节之…

    2025年12月1日 科技
    000
  • 最强API调用模型来了!基于LLaMA微调,性能超过GPT-4

    继羊驼之后,又来了个以动物命名的模型,这次是大猩猩(Gorilla)。 虽说目前LLM风头正旺,进展颇多,在各种任务中的性能表现也可圈可点,但这些模型通过API调用有效使用工具的潜力还亟待挖掘。 即使对于今天最先进的LLM,比如GPT-4,API调用也是一项具有挑战性的任务,主要是由于它们无法生成准…

    2025年12月1日 科技
    000
  • 用友集团郭金铜:拥抱AI要重视软件与模型

    21世纪经济报道记者雷晨 实习生魏乾坤 6月6日,由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中国文化产业协会文化元宇宙专业委员会主办的“21世纪卓越董事会人工智能闭门会”召开,主题为“AI领域上市公司创新涌现、技术难题与发展路径”。 要实现产业的数字化转型,必须振兴中国的软件产业,并…

    2025年12月1日 科技
    000
  • 清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳

    2020 年 12 月发布的 CPM-1 是国内首个中文大模型 ;2022 年 9 月发布的 CPM-Ant 仅微调 0.06% 参数就能超越全参数微调效果;2023 年 5 月发布的 WebCPM 是 中文首个基于搜索的问答开源模型。CPM-Bee 百亿大模型是团队最新发布的基座模型,中文能力登顶…

    2025年12月1日 科技
    000
关注微信