​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

训练完就直接上模型。
我们都知道,Mistral 团队向来「人狠话不多」。昨天下午,他们又又又丢出了一个不带任何注解的磁力链接。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

​mistral首个多模态模型pixtral 12b来了!还是直接放出24gb磁力链接

解析一下这个链接,可以看到大小共 23.64 GB,其中包含 4 个文件,其中最大的文件是一个封装的多模态大模型。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

动作快的非官方 Mistral 社区已经将该模型上传到了 Hugging Face。
磁力链接:magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910
Hugging Face 地址:https://huggingface.co/mistral-community/pixtral-12b-240910
这一发布引来如潮好评,有人将其与近日经常出现在话题热榜中的 Reflection 模型做了对比,更是尽显 Mistral 团队踏实做事的风格:

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

Pixtral 12B 的规格和性能
该模型的名字为 pixtral-12b-240910,从名字也能看出,该模型的参数量为 12B。
其中 params.jsom 列出了该模型的相关参数:

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

可以看到,该模型有一个视觉编码器,其支持 1024×1024 大小的图像,有 24 个隐藏层,支持高级图像处理。
该模型的层数为 40、隐藏维度大小为 14,336,注意力头有 32 个。
此外,Pixtral 12B 的词汇库有 131,072 个不同的 token,可以说相当庞大,因此能实现非常细腻的语言理解和生成。
从这些参数和配置也能看出,Pixtral 12B 至少有能力处理文本和图像数据,实现多模态处理。
Pixtral 12B 的发布广受好评,这是因为人们一直在期待开放模型社区也能获得好用易用的多模态模型。Mistral 这条磁力链接将我们向这个方向推进了一步。
不过由于该模型才刚发布,其效果究竟如何还尚未可知,但好在我们也不是完全没有线索。就在昨天,Mistral 低调地举办了一场峰会 Mistral AI Summit,演讲者包括 Mistral CEO Arthur Mensch 以及英伟达 CEO 黄仁勋等。
几位参与者在社交网络上分享了一些现场照片,让我们可以一窥 Pixtral 模型的性能。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

在这张幻灯片中,我们可以看到 Pixtral 12B 支持任意大小的图像和 128k 的上下文窗口。另外,该模型也能处理同时包含文本和图像的大型文档。
具体性能指标上,Pixtral 12B 的表现虽不及 GPT-4o 和 Claude-3.5 Sonnet,但在各基准上全面胜过了 Claude-3 Haiku 和 Gemini-1.5 8B。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

而在几个开放多模态模型中,Pixtral 在大多数基准上都表现最佳,仅在 DocVQA 上略低于 Qwen2 7B。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

Mistral 展示了 Pixtral 的一些具体应用案例。
通过 OCR 将包含数学公式的科学文章图片转录成 Markdown 格式?毫无压力!

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

识别潦草的手写内容,也不在话下。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

提取图片信息和描述图像内容?这已经算是多模态模型的基本能力,那就更无问题了。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

不仅如此,Pixtral 还能理解更加复杂的图像,并从中提取出关键信息和见解:

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

Pixtral 也具备非常出色的解释和推理能力。具体指标上,Pixtral 12B 在 MMMU 和 MathVista 上的多模态知识和推理性能均领先其它参与对比的模型(主要是开放模型,并没有 GPT-4o 和 Claude-3.5 Sonnet)。多模态问答性能也表现卓越,处于领先位置。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

多模态指令遵从以及文本理解能力都表现不错,在某些指标上仅略逊于 Claude-2 Haiku。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

比如它能根据 DNA 图像分析出该图像是在解释 DNA 的结构(相信这个能力很适合用于学习新知识):

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

爱派AiPy 爱派AiPy

融合LLM与Python生态的开源AI智能体

爱派AiPy 1 查看详情 爱派AiPy

也能基于手绘的潦草网页设计草稿推理生成 HTML 代码:

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

拍一拍考试卷让其解答数学选择题,也轻轻松松就能完成:

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

至于 Pixtral 是否支持视频,Mistral 在问答环节分享说他们还未测试过视频帧,但已经尝试过 PFF(点特征融合),并且他们表示 Pixtral「128k 的上下文应该能处理视频」。此外,Pixtral 也能泛化用于卫星图像。
至于如何使用 Pixtral 12B,如果你的硬件性能足够,当然可以自己部署;但 Mistral 的开发者关系负责人 Sophia Yang 也表示,未来会通过 Mistral 的 Le Chat 和 La Platforme 提供该模型。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

Mistral 的愿景:让 AI 好用且有用
根据网友们分享的消息,在 Mistral AI Summit 上,该公司分享了他们的愿景。
他们认为,要让 AI 有用,最关键的其实是系统问题。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

但对不懂相关技术的普通用户来说,这个系统显得非常复杂。Mistral 想做的就是简化用户的使用流程,降低用户的使用成本。他们想把复杂的技术部分都整合进 La Platforme,让用户只需进行简单的配置就能享受 AI 带来的便利和效率。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

此外,为了让 AI 有能力解决复杂问题,将用户交互用于 AI 模型的持续训练是很有必要的。同时还需要持续地将新软件整合进 AI 的工具箱,提升其能力。
目前,Mistral 的模型矩阵中已经包含了用于通用任务和科研任务的多种免费模型。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

另外,该公司还为编程任务开发了 Codestral 模型,支持 80 多种编程语言并且性能优秀。不过需要指出,虽然 Mistral 允许研究者基于研究和测试目的免费使用 Codestral,但若想将其投入商业应用,则需要向其购买商用权限 —— 这也算是该公司为数不多的盈利项目之一。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

今年 6 月份,Mistral 以 60 亿美元的估值获得了 6.4 亿美元投资,之后不久便发布了该公司的旗舰模型 Mistral Large 2。
Mistral Large 2 的参数量为 123B,支持多语言和函数调用,具备强大的推理和代码能力,整体性能虽不及当前最佳的 GPT-4o 和 Claude-3.5 Sonnet,但却超过了 405B 参数的 Llama 3.1。同样,Mistral Large 2 也免费开放给非商业用途。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

Mistral 团队绝对算是 AI 模型开发领域的一股清流。在 AI 领域普遍关注营销宣传的如今,Mistral 的 Twitter 虽有 10 万关注者却并未关注任何一个人,其仅有的 10 条推文也几乎都是在发布新模型,其 CEO Arthur Mensch 的个人账户也毫不活跃。
Mistral AI 成立于 2023 年 5 月,是一家法国人工智能初创公司,也是为数不多来自欧洲的大模型开源领域的明星团队。一个有趣的小知识是因为该公司来自法国,所以 Le Chat 的意思其实就是「猫」,这也是其 Logo 之所以像一只猫的原因。

​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接

Mistral AI 曾在 2023 年 6 月获得了创纪录的 1.18 亿美元种子轮融资(据称是欧洲历史上最大的种子轮融资)。当然,这个纪录在前些天已经被 Ilya Sutskever 创立的 Safe Superintelligence Inc. 打破。

参考链接:

https://x.com/MistralAI/status/1833758285167722836

https://x.com/swyx/status/1833926630861070359

以上就是​Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/790355.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月26日 13:58:27
下一篇 2025年11月26日 13:58:50

相关推荐

  • 表单中的AI助手怎么集成?如何添加智能填写建议?

    表单中添加ai助手的核心是通过前后端协同实现智能填写建议,具体需从后端智能服务构建、前端交互逻辑、性能优化及复杂场景处理等方面入手。首先应根据需求选择合适的ai能力:若仅需关键词匹配,可采用轻量级规则引擎或本地模型;若需语义理解,则调用大型语言模型(llm)api如gpt、文心一言等更为合适。后端需…

    2025年12月22日
    000
  • 网页标题怎么设置?title标签应该放在哪里?

    网页标题由html中 区域内的标签定义,必须且只能出现在该位置;2. 设置标题需在内插入标签并填入文本,如“我的个人博客”;3. 撰写标题时应包含核心关键词但避免堆砌,控制在50-60字符内,确保独特性与吸引力,并与内容高度相关;4. 未设置或设置不当会导致用户体验差、seo效果差、社交媒体分享效果…

    2025年12月22日
    000
  • meta标签的用途是什么?网页元信息如何设置?

    设置meta标签需在html的 区域添加对应代码;2. 必设标签包括:防止乱码;3. 确保移动端正常显示;4. 提升搜索点击率;5. 控制页面是否被索引;6. 添加ogp标签如og:title、og:image等优化社交分享效果;7. 避免滥用keywords标签,因其已基本被搜索引擎忽略;8. 注…

    2025年12月22日 好文分享
    000
  • JavaScript图算法实现_javascript复杂计算

    图算法在JavaScript中通过邻接表或矩阵表示,适用于社交网络、导航等场景,结合DFS、BFS、Dijkstra等算法可高效处理路径与关系问题。 图算法在JavaScript中能高效处理复杂关系和路径问题,尤其适合社交网络、地图导航、依赖分析等场景。虽然JavaScript不是专为数值计算设计的…

    2025年12月21日
    000
  • JavaScript 的算法中,深度优先搜索与广度优先搜索各有何适用场景?

    DFS适合探索所有路径、连通性及深度较大场景,BFS适合最短路径、层级遍历及目标较近情况,选择依据是问题是否要求最少步数或最短距离。 深度优先搜索(DFS)和广度优先搜索(BFS)是两种基础的图或树遍历算法,在 JavaScript 中常用于解决不同类型的路径、查找与结构问题。它们的核心区别在于搜索…

    2025年12月20日
    000
  • JS 树形结构操作指南 – 深度优先与广度优先遍历算法的应用场景

    DFS和BFS是JavaScript处理树形结构的核心遍历算法,DFS优先深入分支,适用于路径查找、序列化等场景,可用递归或迭代实现;BFS逐层扩展,适合层级渲染、最近节点查找,通常用队列实现;选择依据包括数据结构特征和具体需求,如深度、宽度、内存限制及访问顺序要求。 在JavaScript中处理树…

    2025年12月20日
    000
  • 如何实现自定义的迭代器和可迭代对象,以及这些特性如何简化复杂数据结构的操作?

    自定义迭代器和可迭代对象通过实现__iter__和__next__方法,使数据结构能被for循环遍历,封装复杂逻辑,支持惰性求值、内存优化及多种遍历方式;生成器以更简洁的方式实现相同功能,适用于简单或一次性迭代场景,而类实现更适合需复杂状态管理或多策略遍历的情况。 自定义迭代器和可迭代对象,本质上为…

    2025年12月20日
    300
  • 什么是并查集?并查集的典型应用场景

    并查集通过维护一个森林结构来高效处理集合的合并与查询问题,其核心操作为find和union。find操作用于确定元素所属集合的根节点,并通过路径压缩优化,将查找路径上的所有节点直接连接到根,从而提升后续查询效率;union操作用于合并两个不同集合,通常结合按秩或按大小合并的策略,即将较小树的根连接到…

    2025年12月20日
    000
  • 图的定义是什么?JS如何表示图结构

    图在JavaScript中常用邻接表表示,适合稀疏图和动态操作,邻接矩阵适用于顶点固定且边密集的场景,边列表则用于特定算法;实际应用如社交网络、导航和推荐系统均依赖图结构。 图,简单来说,就是由一些“点”(我们称之为顶点或节点)和连接这些点的“线”(我们称之为边)构成的抽象结构。它最核心的作用是用来…

    2025年12月20日
    000
  • 什么是层序遍历?队列实现层序遍历

    层序遍历之所以重要,是因为它提供了一种广度优先的全局视角,适用于寻找最短路径、按层处理节点等问题,如求树的最小深度或判断完全二叉树;它不仅可用于二叉树,还可推广到图的遍历、网络爬虫、社交网络分析、迷宫求解等场景;与深度优先遍历相比,层序遍历使用队列实现,按层访问,空间复杂度与树的宽度相关,适合解决最…

    2025年12月20日
    000
  • 什么是JS数据结构?数据结构在编程中的作用

    JavaScript数据结构是组织和操作数据的核心方式,直接影响程序性能。除常用的数组和对象外,Set和Map提供去重与灵活键值对存储,队列、栈、链表、树和图等可基于JS实现,适用于不同场景。如Set优化查找去重,链表提升插入删除效率,图处理复杂关系。合理选择结构能显著提升性能,避免卡顿。前端中,D…

    2025年12月20日
    100
  • JS如何实现图的邻接表?图的表示方法

    答案:图的两种主要表示方法是邻接矩阵和邻接表。邻接矩阵使用二维数组存储边,适合稠密图,检查边存在性快(O(1)),但空间占用大(O(V²)),遍历邻居慢(O(V));邻接表使用Map或链表存储每个顶点的邻居,空间效率高(O(V+E)),遍历邻居高效(O(degree(V))),适合稀疏图和图遍历算法…

    2025年12月20日
    000
  • JS如何实现广度优先搜索?BFS的应用

    JS实现广度优先搜索(BFS)的核心在于使用队列逐层遍历图或树,结合visited集合避免重复访问,其典型应用包括无权图最短路径、社交网络连接、Web爬虫和迷宫求解,与DFS相比,BFS适合寻找最短路径和层级遍历,而DFS更适合遍历所有路径或处理深度较深的图,优化BFS的方法包括双向BFS、使用优先…

    2025年12月20日
    100
  • 什么是队列?JS中如何实现队列操作

    队列是一种先进先出(fifo)的数据结构,常用于任务调度、消息队列、bfs算法等场景;在javascript中可通过数组或对象实现,数组实现简单但出队操作性能较差(o(n)),推荐使用对象模拟指针(head和tail)实现o(1)时间复杂度的入队和出队操作;与栈(lifo)和链表(灵活存储结构)相比…

    2025年12月20日
    000
  • JS中如何实现图的遍历?DFS和BFS区别

    图的遍历在JS中通过DFS和BFS实现,DFS使用递归深入搜索,适用于路径存在性问题;BFS利用队列逐层扩展,适合最短路径求解;两者可应用于组件依赖分析、路由管理等前端场景。 JS中实现图的遍历,主要依赖深度优先搜索(DFS)和广度优先搜索(BFS)这两种算法。简单来说,DFS像走迷宫一样,一条路走…

    2025年12月20日
    100
  • javascript如何实现数组图结构

    在javascript中实现数组图结构的关键是选择邻接矩阵或邻接表来表示节点和边,并根据图的特性进行遍历与优化。1. 邻接矩阵使用二维数组表示图,适合稠密图,查找边的时间复杂度为o(1),但空间复杂度为o(n²);2. 邻接表使用对象或数组存储邻接节点,适合稀疏图,空间复杂度为o(n+m),但查找边…

    2025年12月20日 好文分享
    000
  • JS如何实现并查集?并查集的优化

    并查集的时间复杂度经过路径压缩和按秩合并优化后接近o(α(n)),其中α(n)是反阿克曼函数,在实际应用中可视为常数,因此可近似认为是o(1),未优化时最坏情况为o(n);其核心优化方法包括路径压缩和按秩合并;主要应用场景有判断图的连通性、kruskal算法中的环检测、动态连通性维护、图像处理中的区…

    2025年12月20日
    000
  • javascript数组如何实现分形结构

    要实现javascript数组的分形结构,核心是利用递归函数构建嵌套数组以模拟自相似性,1. 通过递归函数createfractalbranch生成多层嵌套数组,每个层级包含分支信息及子分支引用;2. 分形结构在数据可视化中的应用包括树状图、旭日图展示层级数据,网络图布局优化,分形艺术生成设计,以及…

    2025年12月20日
    000
  • 怎样用JavaScript实现图结构?

    用javascript实现图结构可以通过对象或数组表示。1) 创建无向图类,使用对象存储节点和边。2) 实现有向图,只需修改无向图的边添加方法。3) 实际应用中,需注意大规模图的性能优化和循环引用处理。这篇文章详细介绍了如何在javascript中实现无向图和有向图,并分享了在实际项目中使用图结构的…

    2025年12月20日
    000
  • 如何将兰链用于AI工作流程自动化

    引言 在飞速发展的AI领域,自动化是提升效率和可扩展性的关键。LangChain是一个开源框架,它提供强大的工具,用于将大型语言模型(LLM)集成到应用程序中。无论您是构建聊天机器人、数据处理管道还是智能决策系统,LangChain都能通过无缝连接不同的组件,实现AI工作流的自动化。本文将探讨如何利…

    2025年12月19日
    000

发表回复

登录后才能评论
关注微信