fig
-
快过 ChatGPT,蚂蚁灵光 AI 助手上线 4 天下载突破 100 万
蚂蚁灵光上线 4 天下载量突破 100 万,冲上 App Store 中国区免费榜第六,灵光首个百万下载速度超过 ChatGPT、Sora2、DeepSeek 等全球主流 AI 产品。 11 月 18 日,蚂蚁集团官宣推出全模态通用 AI 助手“灵光”,首批上线三大功能 ——“灵光对话”、“灵光闪应…
-
StableDiffusion怎样用负面提示剔杂色_StableDiffusion用负面提示剔杂色【负面提示】
通过设置负面提示可有效减少StableDiffusion生成图像中的杂色与噪声。1、在Negative Prompt栏输入noise、blurry、artifacts等词汇,抑制常见杂质;2、使用通用词组如low quality、jpeg artifacts提升整体质量;3、针对特定色斑添加具体颜色…
-
构建AI智能体:决策树的核心机制(二):抽丝剥茧简化专业术语推理最佳分裂点
一、决策树回顾 在大家读这篇文章前,如果对决策树还没有什么概念,可以先看看前一篇《构建ai智能体:决策树的核心机制(一):刨根问底鸢尾花分类中的参数推理计算》,先简单回顾一下决策树:通过提出一系列问题,对数据进行层层筛选,最终得到一个结论(分类或预测),每一个问题都是关于某个特征的判断,而每个答案…
-
支持跨语言、人声狗吠互换,仅利用最近邻的简单语音转换模型有多神奇
AI 参与的语音世界真神奇,既可以将一个人的语音换成任何其他人的语音,也可以与动物之间的语音互换。 我们知道,语音转换的目标是将源语音转换为目标语音,并保持内容不变。最近的任意到任意(any-to-any)语音转换方法提高了自然度和说话者相似度,但复杂性却大大增加了。这意味着训练和推理的成本变得更高…
-
微软AR/VR专利提出使用时间复用谐振驱动产生双极性电源
(映维网Nweon 2023年07月05日)XR头显的面部追踪方案可用于感知用户皮肤的微小运动。在一个示例方案中,头显可配备位于不同位置的多个感测天线的电路。天线信号可以馈入LC谐振电路,并由LC驱动器驱动至谐振。LC谐振电路的输出可以馈入感测放大器,为模数转换器ADC提供合适的信号,而ADC可以将…
-
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
Sora 在 2024 年初的惊艳表现成为了新的标杆,激励着所有研究文生视频的人士争相追赶。每个研究者都怀着复现 Sora 成果的渴望,争分夺秒地努力着。 根据 OpenAI 披露的技术报告,Sora 的一个重要创新点是将视觉数据转换为 patch 的统一表示形式,并通过 Transformer 和…
-
可视化FAISS矢量空间并调整RAG参数提高结果精度
随着开源大型语言模型的性能不断提高,编写和分析代码、推荐、文本摘要和问答(qa)对的性能都有了很大的提高。但是当涉及到qa时,llm通常会在未训练数据的相关的问题上有所欠缺,很多内部文件都保存在公司内部,以确保合规性、商业秘密或隐私。当查询这些文件时,会使得llm产生幻觉,产生不相关、捏造或不一致的…
-
OpenAI把GPT塞进机器人大脑,具身AGI奇点迫近!英伟达微软参投26亿美金独角兽Figure
人形机器人明星公司Figure迎来了高光时刻! 就在刚刚,OpenAI与Figure官宣合作,专为人形机器人打造下一代AI多模态模型。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片 这项合作最大的目的是,增强机器人处理语言和推理的能力…
-
LimSim++:多模态大模型在自动驾驶中的新舞台
论文名称:limsim++: a closed-loop platform for deploying multimodal llms in autonomous driving 项目主页:https://pjlab-adg.github.io/limsim_plus/ 仿真器简介 随着多模态大语言…
-
【大模型学习】现代大模型架构(一): 组注意力机制(GQA)和 RMSNorm
前言 ✍ 在大模型论文学习中,相信很多读者和笔者一样,一开始都会有一种感觉:“现在大模型架构都差不多,主要是数据和算力在堆积。”当笔者慢慢总结llama、qwen、deepseek这些模型架构的时候发现,在 attention、位置编码、ffn 与归一化 上,其实已经悄悄从经典 transforme…