算子简报
2025-01-21 · 算子简报
国产AI大模型DeepSeek R1开源,性能接近OpenAI
•DeepSeek发布并开源了其最新的大型语言模型R1,标志着国产AI技术的一次重大突破。
•该模型在数学、代码和自然语言推理等任务上表现优异,性能与OpenAI的o1正式版相媲美。
•DeepSeek R1的开源将丰富AI生态,推动AI技术的平权发展。
月之暗面推出新一代SOTA模型k1.5,提升多模态推理能力
•月之暗面公司发布了k1.5多模态思考模型,具备卓越的多模态处理能力。
•该模型能够同时处理文本、图像和声音信息,提升对复杂任务的理解能力。
•k1.5在编程和数学问题求解等多种应用场景中表现出色。
智谱发布AI生视频产品清影2.0,支持多种风格生成
•智谱推出了AI生视频产品清影2.0,经过全面升级,显著提升了模型能力和视频生成质量。
•新版本能够生成自然流畅的动作和精美画面,用户只需简单提示即可实现复杂场景。
•清影2.0在艺术风格上也有了突破,支持多种风格的视频生成。
豆包App新语音模式上线,实现唱歌和角色扮演
•豆包App推出了“端到端”语音大模型,标志着其在语音交互领域的重大突破。
•新模型整合了语音识别、理解和生成能力,具备人类般的表达和情感输出。
•新增的“灵魂歌手”和“百变大咖”模式使豆包能够唱歌和进行角色扮演,增强了互动趣味性。
OpenAI即将推出AI工具“Operator”,可控制电脑
•OpenAI正在研发一款名为“Operator”的AI工具,预计将在2025年1月发布。
•该工具能够自主控制个人电脑,执行包括编写代码和预定旅行在内的多项任务。
•尽管在某些安全评估中表现良好,但其在执行任务的成功率上仍低于人类,专家对此表示担忧。
美图WHEE即将上线AI海报功能,支持中文字体
•美图公司宣布即将推出WHEE应用的“AI海报”功能,旨在简化海报制作流程。
•用户只需输入一句话,即可生成多种风格的海报,特别支持中文字体。
•该功能提供强大的自定义排版能力,涵盖多个核心场景,提升用户的创意体验。
百度文库AI功能月活跃用户突破9000万,付费用户超4000万
•百度文库平台的月活跃用户已超过9000万,付费用户数突破4000万。
•过去一年,百度文库新增了100多项AI功能,极大提升了用户的文档处理和学习体验。
•AI功能的强大吸引力推动了用户数量的快速增长。
腾讯混元3D AI引擎上线,轻松生成高质量3D模型
•腾讯推出了混元3D AI引擎,用户可以轻松生成高质量的3D模型。
•该引擎集成了3D功能矩阵、编辑工具和丰富的素材库,提高了创作效率。
•混元3D AI引擎在电商和游戏制作等多个领域展现出广阔的应用前景。
中国科研团队发布VideoChat-Flash,处理速度提升100倍
•中国科研团队推出了VideoChat-Flash系统,显著提升了长视频处理的效率。
•该技术通过减少冗余信息,降低了计算需求,同时增强了模型的理解能力。
•实验结果显示,该方法在多个基准测试中达到了新的性能标准。
Firecrawl Extract推出,简化数据抓取流程
•Firecrawl Extract的推出标志着网络爬虫时代的逐渐落幕,用户无需编写爬虫脚本。
•该工具通过自然语言处理技术,允许用户仅通过文字提示提取网站数据。
•支持多语言和国际网站的数据抓取,确保数据的精准获取。
2024年笔记本电脑中超25%具备生成式AI功能
•研究报告显示,2024年全球PC市场将显著增长,预计出货量达到2.53亿台。
•超过25%的新笔记本电脑将具备生成式AI功能,推动市场升级。
•预计2025年AI笔记本电脑将占据市场近60%的份额,商业订单有望增长。