“iPhone有通话录音了,但录音会自动通知对方”近日引起热议。苹果官方客服对此表示,“通话录音是否通知对方”可能要等iOS 18正式发布时候才能知晓。
根据“AI产品榜”发布的5月最新榜单显示,百度文库AI功能位居国内总榜第一名,这款融入AI功能后的国产老牌产品已两月蝉联第一。
过去一天,国内外AI行业还有哪些热点值得关注呢?让乌鸦君带你一起看看吧。
/ 01 / 大模型
1)Stable Diffusion 3开源倒计时,2B单机可跑碾压闭源Midjourney
此前在Computex 2024大会上,Stability AI联合首席执行官Christian Laforte正式官宣:SD 3 Medium将在6月12日(明天)公开发布。据悉,之后还会开源4B和8B的版本。两个月前,Stable Diffusion 3在人类偏好评估中斩下DALL-E 3和Midjourney v6。
/ 02 / AI应用
1)从AI应用到AI工作流,第三届美图影像节发布6款产品
美图在美图影像节上发布6款产品。美图公司集团高级副总裁陈剑毅发布了三款产品,分别是美图云修V2、开拍V2、美图设计室V3。除上述三款产品,还发布了针对设计需求的站酷设计服务,针对游戏广告营销的奇觅,以及一款AI短片制作工具MOKI。
2)超越kimi豆包!百度文库AI功能位居AI产品榜国内总榜第一名
根据“AI产品榜”发布的5月最新榜单显示,百度文库AI功能位居国内总榜第一名,这款融入AI功能后的国产老牌产品已两月蝉联第一。
据悉,大模型重构后的百度文库能实现智能PPT、智能文档、智能研报、智能思维导图、文档总结与问答、全场景指令编辑等操作,甚至包括智能画本、智能小说和漫画、图片生成文案等高级功能。
3)苹果回应iPhone录音会通知对方:不确定,要等iOS 18正式发布
“iPhone有通话录音了,但录音会自动通知对方”近日引起热议。对此,苹果官方客服表示,“通话录音是否通知对方”可能要等iOS 18正式发布时候才能知晓。
4)360回应图片事件:系重绘,对方要求十倍价格购买模型
AIGC创作者DynamicWang指控360AI新品发布会盗用其AI绘图模型生成的原图。360回应称图片是在原图基础上生成,非盗用,并质疑版权问题。AIGC创作者提出希望360以10价格购买模型,并另行支付赔偿费用。360表示不认同,决定通过诉讼来判断版权问题。
5)微软被曝已将AI研发项目外包给OpenAI,谷歌有望从中受益
网络安全公司Okta首席执行官托德・麦金农表示,谷歌为了捍卫其搜索引擎霸主地位,正努力避免将研发外包。他还提到,微软已经将其所有先进AI工具和软件的研发外包给OpenAI,这可能对谷歌有利,而微软在人工智能领域的地位存在沦为“顾问”的风险。
/ 03 / 投融资情报
1)法国大模型Mistral AI完成B轮6.44亿美元融资,估值60亿美元
法国初创Mistral AI已经完成了备受猜测的B轮融资,筹集了6亿欧元(约合6.4亿美元)的股权和债务混合资金。General Catalyst 领投了这轮融资,这轮融资后的估值达到60亿美元。
据悉,Mistral AI大约一年前筹集了1.12亿美元的种子轮融资,以与OpenAI、Anthropic和其他人工智能巨头竞争。Mistral AI 还发布了在开放权重下使用开源许可证的预训练和微调模型。
2)CampusAI筹集1000万美元种子资金 用于创建元宇宙以学习AI技能
总部位于华沙的CampusAI宣布完成1000万美元种子轮融资,旨在建立一个虚拟在线校园,为企业和个人提供AI培训与实践的新型平台。这笔融资来自波兰天使投资人Maciej Zientara。CampusAI计划利用这笔资金扩张至10个新市场。
3)AI+边缘计算企业江行智能获朗玛峰创投、卓源亚洲等B轮投资
江行智能致力于深度融合边缘计算与人工智能技术,专注新一代云边协同的智能物联网产品与服务。本次融资由朗玛峰创投、卓源亚洲、松禾资本、联想创投、百度风投等多家国内AI投资公司联合战略投资。
/ 04 / AI基础设施
1)美政府欲限制AI芯片核心技术GAA、高带宽内存HBM出口
据彭博社报道,知情人士称,美国拜登政府正考虑加大中国企业购买和开发先进AI服务器芯片的难度。新规可能会影响中国企业自研AI芯片。
报道称,美国商务部正在考虑是否限制中国使用下一代先进芯片制造技术GAA(全环绕式栅极)的能力。其早期讨论还涉及限制高带宽内存(HBM)芯片的出口,而HBM是高性能AI芯片的关键组件。
2)壁仞总裁徐凌杰创业,新公司已成立,做服务器集群、算力优化
前壁仞科技总裁徐凌杰,离开壁仞4个月后,于本月正式成立上海魔形智能有限公司,注册资本高达1000万美金。有知情人士告诉第一财经,魔形智能的公司业务当前尚在非常早期的阶段,公司业务主要贴近服务器集群、算力优化等数据中心侧业务。
3)Intel Labs 发布研究成果:使用神经架构搜索高效为 LLM“瘦身”
Intel Labs宣称可使用神经架构搜索(NAS)高效地为 LLM“瘦身”。他们基于LLaMA2-7B模型的实验表明,该技术不仅能降低模型大小,有时甚至还能让模型的准确度获得提升。
4)手机流畅运行470亿大模型:上交大发布LLM手机推理框架PowerInfer-2,提速29倍
上海交大IPADS实验室推出了面向手机的大模型推理引擎“PowerInfer-2.0”,该引擎能够在内存有限的智能手机上实现快速推理,让Mixtral 47B模型在手机上达到11tokens/s的速度,目前论文已在arxiv公开。与热门开源推理框架llama.cpp相比,PowerInfer-2.0的推理加速比平均达到25倍,最高达29倍。
5)全华人团队推出多模态大模型新基准,GPT-4o准确率仅为65.5%,所有模型最易犯感知错误
来自上海AI Lab、香港大学、上海交大、浙江大学等多家机构提出了全方位的多模态基准测试MMT-Bench,旨在全面评估大型视觉语言模型(LVLMs)在多模态多任务理解方面的表现。评估发现感知错误、推理错误是所有模型最常见的两大错误。
研究人员基于MMT-Bench对30种公开可用的大型视觉语言模型(LVLMs)进行了综合评估。结果显示,即使是InternVL-Chat、GPT-4o和GeminiProVision等先进模型,其准确率也仅分别为63.4%、65.5%和61.6%。
6)顶级ML/LLM专家联名撰写的《过去一年中构建 LLMs 中学到了什么?》三部曲
这套三部曲分享了过去一年中在构建 LLM 应用时的宝贵经验和教训,涵盖了从战术到战略的各个方面。
1、战术篇
提示工程:如何设计有效的提示?使用小型、专注的提示代替复杂的提示。
信息检索:提升知识基础和输出质量的最佳实践。
工作流程:设计可靠的工作流程,确保流程的可管理性。
微调与评测:提示工程不足时,如何进行微调和评测?
2、运营篇
团队建设:如何构建多元化且高效的 LLMs 团队?
持续部署:确保产品质量和用户体验的可靠和可持续部署建议。
3、战略篇
产品市场适应度:先找到 PMF,构建系统而非模型。
成本控制与迭代:如何在保持竞争力的同时控制成本与迭代产品?
LLMs 的实际应用:强调 LLMs 已经足够成熟,可以在实际应用中使用。
最后,构建有效的 LLM 应用比展示演示更加困难,需要从战术、运营和战略三个层面全面考虑。
地址https://applied-llms.org/
未经允许不得转载:CYQY-生活与科技 » 乌鸦AI日报:苹果回应iPhone录音会通知对方;百度文库AI功能位居5月AI产品榜国内总榜第一名