算子简报
2025-02-17 · 算子简报
微信引入DeepSeek模型,腾讯承诺保护用户隐私
•微信开始灰度测试接入DeepSeek R1模型,提升搜索能力。
•腾讯确认参与测试的用户将享受更丰富的搜索服务。
•腾讯承诺不会使用用户的个人信息,确保隐私安全。
百度搜索全面接入DeepSeek与文心深度搜索功能
•百度搜索宣布将接入DeepSeek和文心大模型的深度搜索功能。
•文心大模型的深度搜索功能已于2月13日上线,具备多模态输入输出能力。
•百度文心智能体平台将接入DeepSeek,为开发者提供便利的模型调用途径。
字节跳动发布AI编程工具Trae的Win x64版本
•字节跳动正式发布Trae的Win x64版本,提升用户操作体验。
•Trae的Builder模式通过与AI对话简化任务执行,优化开发过程。
•新版本结合多模态功能和智能自动补全,帮助开发者更专注于创作。
马斯克宣布推出Grok 3,称其为“地表最强AI模型”
•马斯克的xAI公司将发布Grok 3聊天机器人,声称其为最聪明的AI。
•Grok 3具备反思自身错误的能力,能够实现逻辑一致性。
•该模型的发布将加剧全球AI聊天机器人的市场竞争。
Ready AI:输入提示词即可生成专业级网页
•Ready AI允许用户通过简单的文字指令快速生成网页界面。
•该工具提供实时预览和版本对比功能,提升设计效率。
•用户可以自由选择框架、颜色风格和布局结构,甚至上传图片。
QQ浏览器接入DeepSeek-R1,增强搜索体验
•QQ浏览器于2月16日接入DeepSeek-R1模型,提供便捷的搜索体验。
•新模型具备深度思考、联网搜索和多轮对话功能。
•用户可在手机和电脑端使用DeepSeek模型,支持微信公众号信息。
Light-A-Video:无需训练实现视频重新打光
•Light-A-Video技术通过一致光注意力模块解决视频重光照问题。
•该方法显著提升视频质量和时间一致性。
•创新技术在处理光源不一致方面表现出色。
Meta推出Pippo模型,生成高分辨率多视角图片
•Meta的Pippo模型能够从单张照片生成高达1K分辨率的多视角视频。
•用户只需提供一张照片,系统便能自动生成立体效果。
•该技术不需要额外输入参数,简化了生成过程。
微软发布OmniParser V2.0,提升用户操作体验
•OmniParser V2.0旨在将用户界面截图转化为结构化数据。
•新工具通过改进的数据集和算法提高了图标识别的准确性。
•该工具显著提升用户在操作虚拟机时的效率。
月之暗面解密:Long-CoT模型的重要性
•研究员探讨了Long-CoT在小型模型训练中的应用效果。
•OpenAI o1的发布促使团队重新审视技术方向,推进Long-CoT研究。
•Long-CoT被证明在多位数运算中具有显著效果。
Meta研发无创脑机接口,80%准确率实现文字输入
•Meta开发的脑机接口设备可通过读取脑信号实现文字输入。
•该技术利用磁脑电图扫描仪和深度学习模型解码脑电信号。
•尽管设备重达半吨,价格高达200万美元,准确率已达80%。
字节推出FlashVideo高效视频生成模型
•字节跳动发布FlashVideo,采用双阶段生成框架。
•该技术在1080P视频生成任务中降低计算成本超过40%。
•FlashVideo为个性化视频创作提供高效解决方案,预计将引发变革。