算子简报
2025-05-13 · 算子简报
国产AI智能体Manus开放注册,无需邀请码
•国产AI智能体平台Manus近期开放用户注册,无需邀请码,用户可直接注册并获得积分奖励。
•该平台由Monica公司推出,凭借其通用型AI Agent的独特魅力迅速走红。
•用户可每日免费执行任务,增加互动性和参与感。
全球首款设计Agent Lovart进入内测阶段
•Lovart AI推出全球首款设计Agent,集成图像、视频和音乐模型,颠覆传统设计工作流。
•用户通过自然语言指令可实现全链路自动化设计,吸引了设计师和初创企业的关注。
•其核心功能包括任务拆解、跨媒介内容创作及智能图文分离,极大提升设计效率。
教育部划定AI使用边界,禁止学生复制AI答案
•教育部发布《中小学人工智能通识教育指南(2025年版)》和《中小学生成式人工智能使用指南(2025年版)》。
•明确禁止学生直接复制AI生成的内容,以防止对独立思考能力的影响。
•教师需引导学生进行批判性思维训练,分析AI生成文本的逻辑缺陷和文化偏差。
昆仑万维开源Matrix-Game,构建可控交互世界
•昆仑万维集团宣布开源Matrix-Game大模型,成为工业界首个开源的10B+空间智能大模型。
•该模型在视觉质量、时序一致性和物理合理性方面表现突出,具备强大的用户交互能力。
•Matrix-Game推动了虚拟世界构建的进程,提升了用户体验。
Google Gemma AI模型下载量突破1.5亿次
•Google宣布其Gemma人工智能模型集合的下载量已突破1.5亿次,显示出其在AI领域的显著进展。
•Gemma是一款多模态模型,能够处理文本和图像,支持超过100种语言。
•这一成就标志着Google在满足全球用户需求方面的努力与成功。
OpenAI推出深度研究报告一键导出PDF功能
•OpenAI推出了一项新功能,允许用户将其深度研究报告一键导出为PDF格式。
•这一更新极大提升了报告的实用性和分享效率,特别是在企业环境中。
•用户可以轻松生成包含引用、表格和图片的专业文档,支持决策和沟通。
字节跳动发布DreamO图像定制框架,推动AI图像编辑技术
•字节跳动在Hugging Face平台推出了DreamO,一个集成多种图像编辑功能的全新框架。
•DreamO支持换装、换脸、风格迁移等功能,通过开源特性吸引开发者参与。
•该框架标志着AI图像编辑技术的重大突破,推动行业创新。
月之暗面Kimi界面升级,增强用户互动体验
•月之暗面科技有限公司的智能助手Kimi进行了重大界面升级,提升用户体验和信息呈现能力。
•此次升级引入了多模态容器,支持实时K线图、HTML预览和语音播报等功能。
•新功能增强了用户与Kimi的互动,提供更直观的信息获取方式。
阿里MNN更新,移动端多模态AI能力增强
•阿里巴巴的MNN项目发布了新版MnnLlmApp,支持Qwen-2.5-Omni-3B和7B模型。
•该应用支持文本、图像和音频的生成与识别,具备高效性能和低资源占用。
•MNN的开源属性和对主流模型的支持,使其成为移动端多模态AI开发的理想平台。
ChatGPT推出SharePoint连接器,提升企业数据分析效率
•ChatGPT最近推出了一项新功能,允许用户通过SharePoint连接器访问公司数据。
•这一功能专为ChatGPT Plus、Pro和Team用户设计,帮助企业在数据管理和分析方面实现更高效的工作。
•通过此集成,ChatGPT可以从多个SharePoint站点中分析和总结内容,并提供来源引用。
新一代开源视觉编码器OpenVision发布,提升图像处理效率
•加州大学圣克鲁兹分校推出的OpenVision是一个全新的视觉编码器系列,为开发者和企业提供灵活的选择。
•OpenVision支持多种模型和灵活的部署架构,在多模态基准测试中表现优异。
•该系列旨在提升图像处理和理解的效率,适应多种应用场景。
福布斯发布中国人工智能企业TOP 50榜单,展示行业崛起
•2025年福布斯发布的中国人工智能科技企业TOP50榜单,展现了中国在全球AI领域的崛起。
•超过4500家AI企业在智能制造、医疗、自动驾驶等领域实现了规模化应用。
•中西部地区企业入选数量显著增加,显示出科技创新的突破。
腾讯推出元宝工具,深度理解图片内容
•腾讯推出的“元宝”工具利用Hunyuan T1-Vision模型,能深度理解图片内容。
•该工具简化信息获取,提高准确性和效率,适用于多种场景。
•用户可通过拍照获得植物的详细信息,提升互动体验。