gemini
-
小米旗舰设备国际版将接入谷歌 Gemini 大模型,OPPO 此前已接入
感谢网友 diixx 的线索投递! 8 月 9 日消息,小米创办人雷军 8 月 7 日宣布,小米旗舰设备国际版将接入谷歌 ai 大模型 google gemini。 小米小爱同学「大模型小爱」:支持自然问答、图片编辑、车外唤醒防御,覆盖核心品类设备。 红米 澎湃 OS 全 AI 功能:包括小爱输入助…
-
谷歌 Pixel 9 系列手机发售时间不同,Pro 和 Fold 机型要等到 9 月
8 月 14 日消息,谷歌今日正式发布了 pixel 9 系列手机。与此前系列仅有两款机型不同,此次谷歌一口气推出了四款手机,包括标准版 pixel 9、pixel 9 pro、全新尺寸的 pixel 9 pro xl 以及第二代折叠屏手机 pixel 9 pro fold。 然而,请注意,新手机的…
-
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
Sora 在 2024 年初的惊艳表现成为了新的标杆,激励着所有研究文生视频的人士争相追赶。每个研究者都怀着复现 Sora 成果的渴望,争分夺秒地努力着。 根据 OpenAI 披露的技术报告,Sora 的一个重要创新点是将视觉数据转换为 patch 的统一表示形式,并通过 Transformer 和…
-
LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训
过去的图像生成模型经常因为主要呈现白人形象而受到批评,而谷歌的 Gemini 模型则因为极端的矫枉过正而陷入困境。它的生成图像结果变得过分谨慎,与历史事实出现显著偏差,令用户感到惊讶。谷歌声称,该模型的谨慎程度超出了开发者的预期。这种谨慎不仅体现在生成的图像中,还表现在通常将一些提示视为敏感提示,进…
-
吞吐量提升5倍,联合设计后端系统和前端语言的LLM接口来了
大型语言模型 (llm) 被广泛应用于需要多个链式生成调用、高级提示技术、控制流以及与外部环境交互的复杂任务。尽管如此,目前用于编程和执行这些应用程序的高效系统却存在明显的不足之处。 研究人员最近提出了一种新的结构化生成语言(Structured Generation Language),称为SGL…
-
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
之前引爆了AI圈的Mamba架构,今天又推出了一版超强变体! 人工智能独角兽AI21 Labs刚刚开源了Jamba,世界上第一个生产级的Mamba大模型! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ Jamba在多项基准测试中表现亮眼,与…
-
阿里7B多模态文档理解大模型拿下新SOTA
多模态文档理解能力新sota! 阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5,针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战,提出了一系列解决方案。 话不多说,先来看效果。 复杂结构的图表一键识别转换为Markdown格式: ☞☞☞AI 智能聊天, …
-
Gemini 3— 谷歌推出的新一代多模态理解与推理AI模型
Gemini 3是什么 gemini 3 是谷歌最新推出的ai模型,被誉为全球最先进的多模态理解与推理模型。模型具备强大的推理能力,刷新多项基准测试记录,如在 lmarena leaderboard 上以 1501 elo 高分登顶。gemini 3 支持多模态输入,包括文本、图像、视频等,能处理复…
-
人人都能生成教程图?Nano Banana Pro 让你0基础做出年薪50万的效果图!
最近在 ai 领域中,若要选出一款能让普通用户“瞬间感受未来”的工具,nano banana pro 绝对位列前茅。它之所以如此出圈,关键在于接入了最新的 gemini 3 pro 模型,使其具备了更强大的世界知识库。 从手账制作、漫画上色、动漫角色联动,到电商应用、人物替换、科普图示、数学题求解……
-
Lighthouse携手Coddebuddy,助力实现象棋对战小游戏一键发布
期待已久的项目一键部署到lighthouse的功能终于在codebuddy上线了,而且codebuddy最近还在举行体验云端部署免费领取lighthouse实例的活动,这下不得不体验一下了。 Codebuddy下载 Codebuddy分为国内版和国际版,下载链接分别如下: 国内版:Codebuddy…