算子简报

2025-03-04 · 算子简报

1

智谱推出首个支持汉字生成的开源文生图模型CogView4

智谱发布了CogView4,这是首个支持生成汉字的开源文生图模型。

该模型在DPG-Bench基准测试中排名第一,成为开源文生图模型中的SOTA。

CogView4支持任意分辨率和复杂语义对齐,满足广告和短视频等领域的需求。

2

MiniMax推出全新图像生成模型Image-01,成本仅为1/10

MiniMax推出了其首款文本到图像生成模型Image-01,具备卓越的提示控制能力。

该模型的高效批处理功能和极具竞争力的价格使专业级AI创作更易获取。

Image-01支持逻辑一致且艺术感十足的图像生成,受到用户广泛关注。

3

腾讯元宝下载量超DeepSeek,登顶苹果免费App下载榜首

腾讯元宝在苹果中国区App Store的免费App下载排行榜上取得了显著成就。

该应用成功超越DeepSeek,成为下载量最高的应用。

腾讯加大对元宝的推广力度,尤其是在微信平台的曝光。

4

秘塔AI搜索新增视频搜索功能,提升用户体验

秘塔网络科技推出了新的AI搜索功能,新增视频搜索模块。

该功能通过分析大量视频内容,帮助用户更高效地找到所需视频。

用户可以快速定位到感兴趣的视频,提升了搜索体验。

5

AI生成3D城市模型GaussianCity,生成速度提升60倍

南洋理工大学的研究团队推出的GaussianCity技术在3D城市模型生成领域取得了显著突破。

该技术实现了生成速度的60倍提升,并支持无边界的3D城市生成。

GaussianCity采用创新的BEV-Point表示方法,显著提升了计算效率和可扩展性。

6

Ollama大模型工具被指存在严重安全漏洞

国家网络安全通报中心发布了针对Ollama的安全预警,指出其存在严重安全漏洞。

专家分析表明,私有化部署用户面临更大风险,可能导致数据泄露和服务中断。

用户需加强安全意识,及时排查隐患,发现攻击迹象应立即报告相关部门。

7

超强视频生成模型Wan2.1 GP:低配GPU也能搞定大片

DeepBeepMeep团队推出的Wan2.1GP是一个针对低端GPU用户优化的视频生成模型。

该模型在多个基准测试中表现优异,支持多种生成任务。

Wan2.1GP兼容性强,仅需8.19GB显存,适合低端用户。

8

火山引擎宣布大模型应用开源,释放AI创新潜力

火山引擎通过X平台宣布大模型应用正式开源,并推出全新“大模型应用实验室”。

源应用涵盖手机助手、Deep Research等前沿AI工具,受到用户热议。

这一举措降低了AI开发门槛,推动行业协作与创新。

9

QQ浏览器推出“AI作文辅导”功能,助力学生写作

QQ浏览器推出的“AI作文辅导”功能旨在帮助学生提升写作能力。

该功能通过全流程的写作技巧辅导,帮助学生在立意、提纲、素材和范文生成的每一步中获得指导。

QQ浏览器强调多阅读和思考的重要性,鼓励学生掌握写作技巧。

10

Anthropic融资35亿美元,估值飙升至615亿美元

Anthropic近日完成了35亿美元的E轮融资,融资后估值达到615亿美元。

此次融资由Lightspeed Venture Partners领投,显示出投资者对AI市场的持续热情。

资金将用于推进下一代AI系统的开发,预计年收入在2024年达到了10亿美元。

11

xAI Grok-3击败GPT4.5,登顶大模型竞技场

xAI最近推出的Grok-3模型在Chatbot Arena排行榜上表现出色,超越了GPT4.5-Preview。

该模型在多个领域展现了卓越性能,包括编码、数学、创意写作等。

Chatbot Arena使用Elo评级系统进行模型排名,标志着xAI在AI领域的显著进展。

12

雷军在两会建议加强“AI换脸拟声”违法侵权治理

小米集团创始人雷军在全国两会上提出五项重要建议,推动AI领域的发展。

他强调完善人工智能终端标准体系的重要性,并呼吁制定以用户体验为导向的标准。

建议加强对“AI换脸拟声”违法侵权的治理,保护用户权益。