训练_第9页_创想鸟

通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5

赶在春节前，通义千问大模型（qwen）的 1.5 版上线了。今天上午，新版本的消息引发了 ai 社区关注。新版大模型包括六个型号尺寸：0.5B、1.8B、4B、7B、14B和72B。其中，最强版本的性能超越了GPT 3.5和Mistral-Medium。该版本包含Base模型和Chat模型，并提供…

程序猿

2025年11月7日 • 用户投稿

4000

「AI透视眼」，三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

遮挡是计算机视觉很基础但依旧未解决的问题之一，因为遮挡意味着视觉信息的缺失，而机器视觉系统却依靠着视觉信息进行感知和理解，并且在现实世界中，物体之间的相互遮挡无处不在。牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作系统性解决了任意物体的遮挡补全问题，并且为这一问题提出了一个…

程序猿

2025年11月7日 • 用户投稿

0000

仅需200M参数，零样本性能超越有监督！谷歌发布时序预测基础模型TimesFM

时间序列预测在各个领域中起着重要作用，例如零售、金融、制造业、医疗保健和自然科学等。在零售行业中，通过提高需求预测的准确性，可以有效降低库存成本并增加收入。这意味着企业能够更好地满足客户需求，减少库存积压和损失，同时提高销售额和利润。因此，时间序列预测在零售领域中具有重要的价值，能够为企业带来实质 …

程序猿

2025年11月7日 • 用户投稿

0000

谷歌发布“Vlogger”模型：单张图片生成10秒视频

谷歌发布了一个新的视频框架：只需要一张你的头像、一段讲话录音，就能得到一个本人栩栩如生的演讲视频。视频时长可变，目前看到的示例最高为10s。可以看到，无论是口型还是面部表情，它都非常自然。如果输入图像囊括整个上半身，它也能配合丰富的手势： ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索,…

程序猿

2025年11月7日 • 用户投稿

0000

Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

微软版Sora诞生了！ Sora虽爆火但闭源，给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出了Diffusion Transformer和空间patch策略，但想要达到Sora的性能还是很难，何况还缺乏算力和数据集。不过，研究者发起的新一波复现Sora的冲锋…

程序猿

2025年11月7日 • 用户投稿

2000

发布几小时，微软秒删媲美GPT-4开源大模型！竟因忘记投毒测试

上周，微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。却没想到发布几小时之后，立马被删除了。有网友突然发现，WizardLM的模型权重、公告帖子全部被删除，并且不再微软集合中，除了提到站点之外，却找不到任何证据证明这个微软的官方项目。 ☞☞☞AI 智能聊天, 问答助手, AI 智…

程序猿

2025年11月7日 • 用户投稿

0000

谷歌员工爆料Python基础团队原地解散

什么？谷歌解雇了整个 Python 基础团队？ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 与你直接共事的每个人，包括你的上级，都被裁员——哦，是职位被削减，而你被要求安排他们的替代者入职。这些人被告知在不同的国家担任同样的职位，但他们并…

程序猿

2025年11月7日 • 用户投稿

2000

史上最大重建25km²！NeRF-XL：真正有效利用多卡联合训练！

原标题：nerf-xl: scaling nerfs with multiple gpus 论文链接：https://research.nvidia.com/labs/toronto-ai/nerfxl/assets/nerfxl.pdf 项目链接：https://research.nvidia.c…

程序猿

2025年11月7日 • 用户投稿

2000

GitHub版Devin上线，会打字就能开发应用，微软CEO：重新定义IDE

微软的“github版devin”——copilot workspace，终于上线了！ WorkSpace是一种“Copilot原生”的全新开发环境，目的是让所有开发者都可以用自然语言，把脑海里的创意转化成应用。也就是说，只要有想法，而且会打字，就可以搞软件开发了。 ☞☞☞AI 智能聊天, 问答助…

程序猿

2025年11月7日 • 用户投稿

6000

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 我们熟悉的Meta推出的Llama 3、Mistral AI推出的Mistral和Mixtral模型以及AI21实验室推出的Jamba等开源大语言模型已经成为OpenAI的竞争对手。在大多数情…

程序猿

2025年11月7日 • 用户投稿

0000