算子简报

2025-01-21 · 算子简报

1

国产AI大模型DeepSeek R1开源,性能接近OpenAI

DeepSeek发布并开源了其最新的大型语言模型R1,标志着国产AI技术的一次重大突破。

该模型在数学、代码和自然语言推理等任务上表现优异,性能与OpenAI的o1正式版相媲美。

DeepSeek R1的开源将丰富AI生态,推动AI技术的平权发展。

详情链接
2

月之暗面推出新一代SOTA模型k1.5,提升多模态推理能力

月之暗面公司发布了k1.5多模态思考模型,具备卓越的多模态处理能力。

该模型能够同时处理文本、图像和声音信息,提升对复杂任务的理解能力。

k1.5在编程和数学问题求解等多种应用场景中表现出色。

3

智谱发布AI生视频产品清影2.0,支持多种风格生成

智谱推出了AI生视频产品清影2.0,经过全面升级,显著提升了模型能力和视频生成质量。

新版本能够生成自然流畅的动作和精美画面,用户只需简单提示即可实现复杂场景。

清影2.0在艺术风格上也有了突破,支持多种风格的视频生成。

详情链接
4

豆包App新语音模式上线,实现唱歌和角色扮演

豆包App推出了“端到端”语音大模型,标志着其在语音交互领域的重大突破。

新模型整合了语音识别、理解和生成能力,具备人类般的表达和情感输出。

新增的“灵魂歌手”和“百变大咖”模式使豆包能够唱歌和进行角色扮演,增强了互动趣味性。

5

OpenAI即将推出AI工具“Operator”,可控制电脑

OpenAI正在研发一款名为“Operator”的AI工具,预计将在2025年1月发布。

该工具能够自主控制个人电脑,执行包括编写代码和预定旅行在内的多项任务。

尽管在某些安全评估中表现良好,但其在执行任务的成功率上仍低于人类,专家对此表示担忧。

6

美图WHEE即将上线AI海报功能,支持中文字体

美图公司宣布即将推出WHEE应用的“AI海报”功能,旨在简化海报制作流程。

用户只需输入一句话,即可生成多种风格的海报,特别支持中文字体。

该功能提供强大的自定义排版能力,涵盖多个核心场景,提升用户的创意体验。

7

百度文库AI功能月活跃用户突破9000万,付费用户超4000万

百度文库平台的月活跃用户已超过9000万,付费用户数突破4000万。

过去一年,百度文库新增了100多项AI功能,极大提升了用户的文档处理和学习体验。

AI功能的强大吸引力推动了用户数量的快速增长。

8

腾讯混元3D AI引擎上线,轻松生成高质量3D模型

腾讯推出了混元3D AI引擎,用户可以轻松生成高质量的3D模型。

该引擎集成了3D功能矩阵、编辑工具和丰富的素材库,提高了创作效率。

混元3D AI引擎在电商和游戏制作等多个领域展现出广阔的应用前景。

详情链接
9

中国科研团队发布VideoChat-Flash,处理速度提升100倍

中国科研团队推出了VideoChat-Flash系统,显著提升了长视频处理的效率。

该技术通过减少冗余信息,降低了计算需求,同时增强了模型的理解能力。

实验结果显示,该方法在多个基准测试中达到了新的性能标准。

详情链接
10

Firecrawl Extract推出,简化数据抓取流程

Firecrawl Extract的推出标志着网络爬虫时代的逐渐落幕,用户无需编写爬虫脚本。

该工具通过自然语言处理技术,允许用户仅通过文字提示提取网站数据。

支持多语言和国际网站的数据抓取,确保数据的精准获取。

详情链接
11

2024年笔记本电脑中超25%具备生成式AI功能

研究报告显示,2024年全球PC市场将显著增长,预计出货量达到2.53亿台。

超过25%的新笔记本电脑将具备生成式AI功能,推动市场升级。

预计2025年AI笔记本电脑将占据市场近60%的份额,商业订单有望增长。