The Information报道,OpenAI CEO对股东们表示,正在考虑将其治理结构转变为营利性公司。这或将为OpenAI首次IPO铺平道路(目前公司估值为860亿美元),奥尔特曼也将有机会入股。
上周四,在特斯拉2024年股东大会上,马斯克预测:最终特斯拉可能会从机器人业务中,每年赚取大约 1 万亿美元的利润。
过去几天,国内外AI行业还有哪些热点值得关注呢?让乌鸦君带你一起看看吧。
/ 01 / 大模型
1)英伟达开源3400亿参数大模型,性能对标GPT-4o
英伟达公司近日推出了一款名为“Nemotron-4 340B”的创新模型,标志着人工智能合成数据生成技术的重大突破。Nemotron-4 340B包括基础模型Base、指令模型Instruct和奖励模型Reward,并构建了一个高质量合成数据生成的完整流程。
模型支持4K上下文窗口、50多种自然语言和40多种编程语言,训练数据截止到2023年6月。Nemotron-4 340B在训练中使用了9万亿个token,性能超越了多个竞争对手,甚至媲美GPT-4。其商业友好的许可模式,使得企业能够轻松利用生成数据,从而减少对昂贵的真实世界数据集的依赖。
论文地址:
https://d1qx31qr3h6wln.cloudfront.net/publications/Nemotron_4_340B_8T_0.pdf
2)复旦大学公布高考数学大模型评测结果
本周,复旦大学NLP实验室LLMEVAL团队发布2024年高考数学大模型评测的结果:从高往低排名,新I卷的前三名为阿里千问、讯飞星火、GPT-4o,且阿里千问和讯飞星火对14道数学客观题的准确率大幅领先GPT-4o。新II卷前三为讯飞星火、阿里千问、GPT-4o。
字节豆包、智谱清言、百川等大模型紧随其后,而百度文心一言、Kimi等大模型准确率较低。
3)DreamTech推出全球首个原生3D-DiT大模型Direct3D
DreamTech推出其高质量3D生成大模型Direct3D,并公开了论文。这是首个公开发布的原生三维生成路线的3D大模型,通过采用3D Diffusion Transformer (3D-DiT),解决了高质量三维内容生成难题。
此前,3D AIGC通常采用的技术路线是2D-to-3D lifting,代表性方案包括早期以Google公司提出的DreamFusion为代表的Score Distillation Sampling (SDS)。
4)1分钟内完成报销核对,微软AI Day现场展示Copilot生产力革命
微软AI Day现场展示了Copilot在生产力方面的应用,Copilot可在1分钟内完成核对报销单和生成报表,还展示了AzureAIStudio和Phi-3系列小模型。微软认为未来将是多模型合作的时代,小模型和大模型各有优势,企业可以根据自身需求选择合适的技术路线。
5)科大讯飞:手机上大模型技术合作对接开展中
有网友询问科大讯飞,是否有与华为公司合作,联合开发智能手机市场,科大讯飞回应称,一直在为多家手机厂商提供智能语音和多语种技术服务。科大讯飞也补充,讯飞星火大模型发布后,关于手机上大模型技术合作已经在持续对接开展中。
6)ACL 2024论文盖棺定论:大语言模型≠世界模拟器
大模型是世界模型吗?UA微软等机构最新研究发现,GPT-4在复杂环境的模拟中,准确率甚至不及60%。对此,图灵奖得主LeCun非常认同,并说“世界模型永远都不可能是LLM”。
链接:https://arxiv.org/abs/2405.14832
/ 02 / AI应用
1)苹果AI文生图应用:只能生成卡通图像,将标记生成内容
苹果Apple智能套件中的「Image Playground」应用伴随iOS 18推出。用户可以输入文本和人物照片,让Image Playground生成相关的图像。
苹果软件工程副总裁Federighi在最新的访谈中提到,生成图像的“元数据”将被标记,以便让他人知道该图像是由Apple智能创建的。Image Playground也将只能生成卡通图像,无法生成那种类似照片般逼真的图像,这也是一种防止人们利用其生成图像误导他人的方法。
2)小爱同学接入豆包大模型,手机、SU7已搭载:
小米旗下AI助手“小爱同学”与火山引擎达成合作,双方基于豆包大模型实现更智能的AI交互体验。小爱还能借助字节跳动豆包大模型提供的联网搜索插件能力,实时捕获与头条内容同源的搜索结果,呈现全面且时效性强的答复。
3)苹果高管调侃微软AI,表示苹果早已部署“AI PC”
在今年的苹果WWDC开发者大会后,Apple高管Federighi受采访表示,苹果从2020年来一直推出配备神经引擎的Mac设备,只是苹果没有将它们称为“AI PC”。
4)Meta将推迟在欧洲推出AI聊天机器人
Meta在博文中谈道,其使用欧洲用户帖子来训练其大模型Llama的计划遭爱尔兰数据保护委员阻止。Meta也透露,用欧洲用户帖子训练大模型的计划暂停后,MetaAI聊天机器人也将推迟在欧洲地区推出。
5)麦当劳“炒掉”AI点餐员,叫停与IBM合作的自动点餐测试项目
麦当劳近期饱受争议的自动点餐AI系统将暂时停止测试,这项始于2021年与IBM的合作项目将在2024年7月26日之前结束。外界猜测,麦当劳可能会另寻合作伙伴继续推进相关技术研发。
/ 03 / 投融资情报
1)消息称OpenAI可能成为营利性公司,或将启动6200亿估值的IPO
The Information报道,有知情人士透露,OpenAI CEO奥尔特曼(Sam Altma)对公司股东们表示,公司正在考虑将其治理结构转变为非营利董事会无法控制的营利性公司。OpenAI对此回应称,他们仍然专注于打造让所有人受益的AI,非营利组织将继续存在。
据分析,这样的变化会为OpenAI首次IPO铺平道路,目前公司估值为860亿美元,奥尔特曼也将有机会入股OpenAI。外媒称,一些和OpenAI对接的高管倾向于将公司转变为营利性,以使微软因董事会席位和股东投票权对OpenAI施加更多影响。
2)马斯克计划用Optimus机器人每年创造1万亿美元利润
上周四,特斯拉的股东们重新批准了马斯克(Elon Reeve Musk)的薪酬激励方案。马斯克在特斯拉2024年股东大会上谈到了特斯拉车队的最终形态、对人形机器人Optimus的设想、目前Cybertruck的进展、特斯拉的Model 3/Model Y和Semi,以及特斯拉正在研发的一些新产品。
根据马斯克的预测:特斯拉在人形机器人 Optimus 制造方面的努力,有朝一日可能会超过其汽车业务。最终,特斯拉可能会从机器人业务中,每年赚取大约 1 万亿美元的利润。
3)日本增长最快独角兽即将诞生:SakanaAI成立一年后估值1800亿日元
日本生成式AI初创公司SakanaAI即将获得一笔新的重大投资,这将使该公司估值达到约1800亿日元(约合83亿元人民币)。
谷歌的人工智能研究人员去年7月在东京成立SakanaAI,该公司对生成文本和图像的AI基本模型进行研究。其具有将现有模型相互交叉的“开创性”技术,从而创建出低成本、高性能的AI模型,以及能用日语解决数学问题的LLM和能生成并理解日语图像和文本的模型。该公司已将其部分模型作为开源软件发布。
/ 04 / AI基础设施
1)网信办发布第六批深度合成服务算法备案信息,腾讯混元等492个算法在列:
国家网信办公开发布第六批境内深度合成服务算法备案信息。本次共有 492 个算法通过备案,其中包括腾讯混元大模型多模态算法、零一万物大模型多模态生成算法、KS快意大模型生成合成算法、商汤V-ME视频合成算法、钉钉AI助理智能生成算法等、绘蛙电商模特试装图像合成算法等。
2)达摩院XR实验室负责人已离职创业,做AI硬件
豹料台获悉,原阿里巴巴达摩院XR实验室产品和业务负责人李健涛,于去年11月份离职,并正式和朋友一起创业。知情人透露,李健涛本次创业选择AI硬件方向。
李健涛于2021年加入达摩院,主要负责XR实验室的产品以及业务,同时也是机器智能实验室的AIoT业务负责人。加入阿里之前,他曾在搜狗长期担任IoT事业部产品负责人和副总经理,负责过多款智能硬件产品的开发。其中搜狗AI录音笔曾一度做到行业Top1,糖猫儿童手表以及儿童教育硬件产品做到行业Top2。
3)AI画连环画角色更一致了!人物之间的复杂互动也能处理
中山大学和联想团队联合提出无需训练的多智能体协同框架AutoStudio,该框架采用基于大语言模型的三个智能体来处理交互,并使用基于扩散模型的Drawer生成高质量图像。实验中,AutoStudio无论是在定量还是定性评估中都优于现有方法。
4)Scaling Law触礁「数据墙」?Epoch AI发文预测LLM到2028年耗尽所有文本数据
Epoch AI近期的一篇论文预测,互联网上可用的人类文本数据将在四年后,即2028年耗尽。
未经允许不得转载:CYQY-生活与科技 » 乌鸦AI日报:OpenAI考虑成为盈利性企业,或为IPO打开大门;马斯克预测Optimus机器人每年将创造1万亿美元利润