感谢关注YepAI「野湃AIGC信息资源工具站」,本板块筛选时下新鲜AI资讯,包含国内外相关新闻、融资动态、热门产品、行业政策等等。收藏页面或关注页尾公众号,方便第一时间找到我们。
每条简报下方已标注信息来源,直接点击可以浏览原篇。
2024年12月25日·周三
Qwen开源视觉推理模型QVQ,像物理学家一样更睿智地看世界!
Qwen团队发布开源多模态推理模型 QVQ ,基于Qwen2-VL-72B构建,提升AI的视觉理解和复杂问题解决能力。QVQ在MMMU评测中得分70.3,显著优于Qwen2-VL-72B-Instruct,在数学相关基准测试中表现突出。模型虽有语言混合、递归推理等局限性,但已在视觉推理任务中展现增强能力。
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
OpenAI研究人员提出“ 深思熟虑的对齐 ”新方法,旨在提升AI模型安全性。该方法通过直接教授模型安全规范,并训练其在生成响应前推理这些准则,将安全原则融入推理过程中。分为监督微调和强化学习两个阶段,使用模型生成的数据和思维链推理,降低资源需求。o1模型部署此技术后,在StrongREJECT基准测试中得分0.88,显著高于GPT-4o的0.37,同时减少了误拒,准确率高达93%。
2025 AI Agent剑指何方?两份前沿报告描绘全景地图
2024年,AI Agent成为热门概念,被视为大模型应用落地的最佳形式。LangChain和Langbase的报告显示,51%的受访者已在生产中采用AI Agent,78%计划近期引入。中型企业最积极,非科技公司与科技公司部署AI Agent的比例相当。OpenAI和谷歌是最受欢迎的大模型提供商。准确性是选择AI Agent的首要因素,其次是安全性和可定制性。AI Agent在研究总结、个人生产力工具和客户服务等领域被广泛采用。性能质量是生产中采用AI Agent的主要顾虑。
做出AI科学家的Sakana AI又放大招,大模型自动搜索人工生命系统
Sakana AI公司开发了搜索人工生命的系统 ASAL ,通过基础模型自动化搜索人工生命模拟,探索可能存在的“生命”。ASAL展示了在多种人工生命基质中发现新生命形式的能力,为人工生命研究提供了新范式,加速了对涌现、进化和智能的理解,有望启发下一代AI系统的发展。
杭州CPU黑马宣布数亿元融资,在研服务器AI CPU芯片
国产CPU创企进迭时空完成数亿元人民币A+轮融资,由香港Brizan III期基金领投,资金将用于高性能RISC-V AI CPU和服务器AI CPU产品的研发及市场拓展。公司总部位于杭州,专注于构建面向大模型时代的原生计算平台,助力AI计算机和机器人等新应用发展。进迭时空已布局全栈计算技术,形成软硬全栈计算系统解决方案,推动RISC-V高性能计算芯片规模化进入行业市场,应用于电力、电信、工业等领域。
AI视频创企智象未来又拿新融资,数亿元!
AI视频生成公司智象未来( HiDream.ai )完成数亿元人民币A轮融资,由合肥产投领投,安徽省人工智能母基金和湖北省长江电影集团等参与。智象未来由加拿大工程院外籍院士梅涛博士创立,专注于视觉多模态基础模型及创新应用。公司自研的“智象大模型”支持文本、图像、视频、3D互生,提供分钟级营销视频生成服务,累计AIGC内容生成量破千万,服务超3万家企业。
星火浏览器插件新升级!能读会答、能翻译会总结
讯飞星火浏览器插件 新升级,集成了讯飞星火V4.0底层能力,支持Chrome、Edge等主流浏览器。新增功能包括“继续提问”以深入讨论获取答案、网页全局对照翻译、一键朗读以及句子段落总结,提升阅读效率。插件以6M+极小内存运行,提供AI搜索、网页总结、划词收藏等功能,旨在让网页阅读与信息搜索更轻松高效。
2024年12月24日·周二
马斯克xAI获60亿美元新融资,和特斯拉和SpaceX大搞AI生态
马斯克的xAI公司宣布完成60亿美元C轮融资,主要投资方包括A16Z、Blackrock、富达管理研究公司等。英伟达和AMD作为战略投资者继续支持xAI基础设施扩展。资金将用于加速基础设施建设、推出数十亿人使用的突破性产品和技术研发,实现公司使命。xAI的新一代旗舰模型Grok 3正在训练中,将推出利用 Grok 、Colossus和X改变人类生活、工作和娱乐方式的新产品。
「像素绽放PixelBloom」完成国家队B2轮融资,打造全球AI办公软件超级工场
AIGC科技企业“像素绽放PixelBloom”完成B2轮融资,由北京市人工智能产业投资基金领投。融资将用于产品研发和市场拓展,旨在打造全球AI办公软件超级工场。旗下 AiPPT .com等产品,通过AI辅助PPT制作,已在全球积累超1000万用户。公司从单一产品向平台化战略转变,构建AI办公软件生态,推动行业发展。
上海国资和腾讯联手投资,“大模型六虎”阶跃星辰获数亿美元B轮融资
AI大模型独角兽阶跃星辰完成数亿美元B轮融资,投资方包括上海国有资本投资有限公司、腾讯投资等。本轮融资将用于基础模型研发,强化多模态和复杂推理能力,扩大C端应用场景。公司由微软前全球副总裁姜大昕博士领导,致力于实现AGI,已发布多款自研基座模型,并与多家企业达成合作。
2024年12月20日·周五
快手可灵 1.6 模型发布,他们又一次超越了自己
可灵近日推出了1.6版本,实现了图生视频的巨大飞跃。更新重点包括物理规律真实感、人物运动表演和语义理解的大幅提升。新版本在切食物、倒茶、跳舞等动作的物理反馈上表现出色,人物表情和动作的细节也更加丰富自然。文本响应度、画面美感及运动合理性均有明显提升。
苹果Mac用户狂喜!ChatGPT深度集成应用,支持 Xcode、Notion 等30+应用,AGI彩蛋曝光
OpenAI在第11天的直播中宣布 ChatGPT 与Mac应用的深度集成,特别在编程和写作方面进行了更新。现在,用户可以通过简单的复制粘贴操作,与Warp、XCode等应用协同工作,无需详细交流即可执行任务。ChatGPT支持在语音模式下与Notion、Apple Notes等应用协同工作。新功能已在Mac最新版ChatGPT应用中推出,Windows用户还需等待。
国家电网发布国内首个千亿级多模态电力行业大模型
国家电网发布了国内首个千亿级多模态电力行业大模型“光明电力大模型”,模型参数规模达到千亿级别,具备电力知识记忆理解、多模态融合分析等能力,被誉为能源电力领域的人工智能“专家”。模型已在中国信通院、电子标准院通过权威检测,专业能力达到“卓越级”,在电网规划、运维、运行、客户服务等多个领域得到应用,提升了电网安全稳定运行和新能源消纳能力。
2024年12月19日·周四
人人可享 AI 编程:免费版 GitHub Copilot 上线,VS Code 每月补全 2000 次代码
微软旗下GitHub推出免费版 GitHub Copilot ,支持开发者在Visual Studio Code中免费使用AI辅助编程服务。全球1.5亿开发者现可在VS Code体验AI编程。免费订阅包括每月2000次代码生成和补全,以及50次编程问题解答。用户可选择Anthropic的Claude 3.5 Sonnet或OpenAI的GPT-4o模型,支持第三方智能体。
OpenAI 加速普及 ChatGPT,开通免费热线电话,老人机也能用ChatGPT了
OpenAI直播第10天,在美国推出 ChatGPT 热线电话服务,号码是:1-800-ChatGPT,也可以打1-800-242-8478,每月可免费通话15分钟,支持智能手机、老人机和座机各种电话设备与ChatGPT语音对话。OpenAI还集成了ChatGPT到WhatsApp,给这个号码发消息来获取回复,负责回答问题的是4o mini。
微信公众号新增“作者朗读音色”功能:可生成作者音色全文音频
微信近日推出了“作者朗读音色”新功能,支持用户在阅读公众号文章时通过点击“听全文”来收听作者音色朗读的文章。作者需在“公众号助手”App中录制例句以复刻语气和情感,创建个性化语音。功能目前处于灰度测试阶段,将逐步向用户开放。
2024年12月18日·周三
AI数据分析公司Databricks一口气融728亿!AI融资新纪录
AI数据分析公司Databricks宣布J轮融资目标为100亿美元(约合人民币728亿元),目前已完成86亿美元,超越OpenAI的65亿美元融资,创下全球AI创企融资新纪录。本轮融资后,Databricks估值达到620亿美元,预计2025年自由现金流将首次为正。公司计划将资金用于开发AI产品、战略性收购及扩展国际市场,满足不断增长的市场需求。
OpenAI o1 推理模型 API 满血开放,成本暴降60%,定制升级
OpenAI在第9天直播中发布 o1 模型API全面开放,成本降低60%,具有更高可定制性,新增函数调用、开发者消息和图像分析等功能。GPT-4o音频成本降低60%,mini版本价格降低10倍。OpenAI推出了偏好微调方法,通过成对样本比较学习使模型适应特定应用场景。实时API支持WebRTC,简化开发流程,降低价格,提供Python SDK支持。旨在提高开发效率和模型性能。
2024年12月17日·周二
智谱完成30亿元新一轮融资,2024年商业化收入翻倍
AI独角兽“智谱”完成30亿元新一轮融资,投资方包括战投及国资,老股东君联资本跟投。资金将用于大模型研发,提升复杂多模态任务处理能力。2024年智谱商业化收入翻倍,API年收入增长超30倍, 智谱清言 预计年收入超千万,用户超2500万。
Meta Ray-Ban 智能眼镜大更新:“实时 AI”可持续分析用户所见内容
Meta Ray-Ban智能眼镜v11版本更新,引入“实时AI”功能,能持续观察用户所见并进行自然对话,无需唤醒词即可互动,AI能记住用户提问并主动提供建议。更新还包括实时翻译功能,支持英语与西班牙语、法语、意大利语的交流,以及Shazam音乐识别集成。
全球最大的仓储机器人公司赴港上市,蚂蚁英特尔是股东
极智嘉作为全球最大的仓储履约AMR解决方案提供商,已向港交所提交招股书,计划在主板上市。极智嘉已连续五年保持领先地位,服务全球约770家终端客户,包括60家财富500强企业。公司三年半累计营收达59亿人民币,其中超70%收入来自中国大陆以外市场。极智嘉专注于AMR解决方案,旨在提高供应链效率,减少人工依赖,计划将IPO募集资金用于研发、市场扩张和供应链发展。
2024年12月13日·周五
OpenAI 数据中心提供商Crusoe融资6亿美元,估值28亿美元
OpenAI的数据中心提供商Crusoe在最新一轮融资中筹集了6亿美元,由Founders Fund主导,Nvidia、Fidelity等参与,公司估值达到28亿美元。Crusoe开发AI数据中心,出租Nvidia GPU的云服务。公司正在德克萨斯州阿比林建设大型数据中心园区,将为Oracle和OpenAI提供服务,已筹集34亿美元债务以资助配备Nvidia下一代旗舰芯片Blackwell的项目。
Google 发布了「虚拟现实」版 Android XR,想让你把熟悉的应用「戴在头上」
Google发布了全新的Android XR操作系统,专为下一代计算构建,兼容各种XR设备,从VR头显到AI眼镜。系统以Android为底层,集成AI能力,提供沉浸式体验,如实时信息查询和多窗口功能。Google提供开发工具包,帮助开发者将2D Android应用快速适配到XR平台。首批搭载Android XR的设备包括三星的Project Moohan VR头显,与高通合作的AR眼镜。
千寻智能一年三轮融资数亿元,构建下一代智慧劳动力
千寻智能由产业老兵和清华教授联合创立的具身智能初创企业,已完成三轮融资数亿元。公司采用”数据金字塔”模式,结合互联网视频数据、仿真数据、遥操数据和强化学习,构建能控制各类机器人执行任务的具身模型,目标是打造下一代智慧劳动力。
OpenAI版《Her》全量来袭:实时视频对话,你每个动作AI都看得见
OpenAI直播第六天,推出”Santa Mode”(圣诞模式),实现《Her》式视频通话功能。可通过点击”雪花”与AI进行圣诞老人风格对话,开启摄像头让AI”看见”你。新功能包括实时视频通话、屏幕共享和图片上传,即日将在 ChatGPT 移动应用中推出。一周内,将向所有团队用户以及大多数Plus和Pro用户开放。
2024年12月12日·周四
造梦次元完成近亿元人民币融资,多家顶级风投和大厂共同投资
造梦次元 完成近亿元人民币A轮融资,由锦秋基金领投,高榕创投、明势创投、商汤科技等参投。公司专注于多模态AI驱动的内容平台,提供虚拟角色互动体验,日均活跃互动时间超100分钟。融资将加速技术研发和市场拓展,优化创作者工具,拓展海外市场,重视内容安全与合规。
百度文库AI再升级,「专业PPT生成」功能上线!打工人终于有救了
百度文库 推出「专业PPT生成」功能,通过AI技术帮助用户一键生成高质量PPT。只需输入关键词或主题,可快速获得内容明确、主题突出的专业演示文稿。新功能采用商务化PPT版式,提供清晰的结构和视觉冲击力,支持个性化编辑,包括字体、颜色和动画效果,助力职场汇报和晋升。
OpenAI直播第五天,OpenAI正式成为苹果AI的”贤内助”
OpenAI与苹果达成合作,将 ChatGPT 集成进iOS、iPadOS和macOS系统。此次整合包括Siri协同、写作工具增强和iPhone相机控制功能。用户可通过Siri启用ChatGPT处理复杂任务,撰写和总结文档,基于视觉智能分析拍摄对象。合作使OpenAI成为苹果AI的“贤内助”,直接触达数十亿苹果设备用户,可能改变科技行业格局。
全球首个”AI 程序员”Devin 全面开放:可独立开发/修复bug,月费500美元
全球首个AI程序员 Devin 已全面开放,支持个人开发者和团队以每月500美元订阅服务,包括Slack集成、IDE扩展和技术支持。Devin能熟练使用多种编程语言,独立完成网站和应用构建、部署,能发现修复代码缺陷。Devin采用沙盒计算环境,内置代码编辑器和浏览器,能快速学习和适应新技术,理解复杂的编程上下文。
2024年12月11日·周三
字节内部判断AI对话类产品天花板可能不高,提升剪映即梦优先级
字节跳动反思AI对话产品如 豆包 的局限性,认为可能仅为AI产品的“中间态”。豆包用户活跃度不高,日均使用时长和频次增长有限,商业化前景不明。字节计划资源转移至多模态产品,提升 即梦 产品优先级,探索更视觉化、低门槛的AI产品,打造AI时代的“抖音”。即梦月活高达1.7亿,全球排名第二。
ChatGPT语音负责人创业AI语音,a16z首轮重注4000万美金
前ChatGPT语音负责人Conneau,创立 WaveForms AI 专注于音频LLM的新公司,旨在2025年前推出与OpenAI和Google竞争的AI音频产品。已获得a16z领投的4000万美元种子资金,开发能“用耳朵感受AGI”的技术,强调人机互动应与人际互动互补,而非取代。
字节视频生成模型PixelDance上线豆包,每日免费生成10个视频
字节跳动的PixelDance视频生成模型在 豆包 电脑版开启内测,用户每日可免费生成10个视频。模型于9月底首次发布。内测反馈,10秒视频切换3-5次镜头效果最佳,场景和角色保持一致性。豆包将持续优化,助力用户创作。
2024年12月10日·周二
OpenAI 正式推出视频生成王者 Sora ,网页挤爆了!
OpenAI 正式发布视频生成大模型 Sora 及其新版本 Sora Turbo,提供1080p分辨率、最长20秒的视频生成能力,支持宽屏、竖屏和方形比例。Sora Turbo版本提升了生成速度。所有视频带有C2PA元数据以验证来源。ChatGPT Plus用户每月可免费生成50个480P视频,Pro用户(月费200美元)享有更高分辨率和更长时长。
OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
OpenAI的第2天直播推出新功能“强化微调”,仅需几十个例子可创建特定领域的专家模型。CEO奥特曼称为2024年最大惊喜。微调后的o1-mini模型得分提高80%,超过 o1 正式版。OpenAI已开启研究计划,支持开发者申请强化微调API的alpha版本。
马斯克 X 公司 Grok AI 聊天机器人向免费用户开放,不再是会员专属
马斯克的AI聊天机器人 Grok 已向X的免费用户开放,每两小时可最多发送10条消息。Grok定位为幽默型AI助手,今年增加了文生图功能,用的是Flux模型。
2024年12月7日·周六
OpenAI第一场直播就炸场!o1满血版上线,ChatGPT Pro订阅费:200美元/月
OpenAI发布最强推理模型 o1 满血版及其Pro版本,ChatGPT Pro订阅计划定价为200美金/月,成为全球最贵的大模型订阅服务。满血版o1在数学、代码能力上显著提升,推理速度比预览版快60%,支持多模态输入。Pro版本为订阅用户提供o1满血版的不限量访问权限,展示在高难度科学问答上的卓越表现。
DeepMind最强「基础世界模型」诞生!
单图生1分钟游戏世界,解锁下一代智能体 谷歌DeepMind发布第二代基础世界模型 Genie 2 ,能从单图生成长达1分钟的3D游戏世界。支持键盘鼠标操作,模拟复杂交互和物理效果,为具身智能体提供无限训练数据。Genie 2的涌现能力包括物体交互、角色动画、物理效果等,为AI研究和游戏开发带来新可能。
谷歌领跑AI视频生成赛道:抢先 OpenAI Sora推出Veo模型,可生成1080P高清视频
谷歌宣布在Vertex AI平台上推出 Veo 模型的私测预览版,面向企业开放。Veo模型能根据文本或图像提示生成1080p高清视频,提供多种视觉风格。Veo生成的视频逼真度极高,如狗狗的毛皮和项圈在运动中保持一致,难以区分是否由AI生成。
2024年12月6日·周五
OpenAI官宣12天12场新品发布会
OpenAI宣布将举行为期12天的系列活动,期间每天发布一个新产品或样品。活动将包括备受期待的文字转视频工具 Sora 和新的推理模型。OpenAI CEO透露,周活跃用户数已超3亿,目标是到2025年增至10亿。
红杉美国最新洞察:2025 年将是 Agent 元年!AI 智能体进入“群体协作”时代
红杉美国合伙人Konstantine Buhler预测,2025年 AI智能体 将进入“群体协作”时代,多个智能体网络将协作完成复杂任务。他强调,AI技术将在医疗和教育领域发挥重要作用,降低成本、提高效率,推动社会进步。
文心一言上线“深度写作”专业版功能:会自己搜素材的AI写作
百度AI推出 文心一言 “深度写作”专业版,能自动搜索素材并创作个性化文章。可通过上传资料或网盘素材,使内容更具体。适用于多种文档创作,模板将持续更新。
刚刚!字节跳动豆包上线图片理解,大模型走向多模态
字节跳动 豆包 APP和PC端新增图片理解功能,能识别图片内容并回答相关问题,如景点位置和动漫人物身份。标志着AI大模型向多模态发展,更加实用。豆包已成为中国日活用户最高的AI大模型产品,AI应用行业月活跃用户规模同比增长373%。
亚马逊年末甩王炸!6款大模型、3nm AI芯片、全球最大AI计算集群,苹果罕见站台
亚马逊在AWS re:Invent大会上宣布将推出6款大模型和3nm第三代AI训练芯片Trainum3,以及最强AI服务器Trn2 UltraServer。 Amazon Nova系列模型 涵盖文本、图像和视频,Reel模型支持生成6秒视频。AWS与Anthropic合作构建全球最大AI计算集群,Bedrock服务更新包括自动推理检查、多Agent协作和模型蒸馏功能。
2024年12月4日·周三
全面对决Suno,国产AI音乐三巨头的突围之战
国内AI音乐领域三巨头——字节跳动的海绵音乐、昆仑万维的天工SkyMusic和趣丸科技的天谱乐,正与全球顶级产品Suno展开激烈竞争。通过提供个性化音乐生成、多模态配乐等创新功能,降低音乐创作门槛。
快手预告“可灵 AI”导演共创计划作品 12 月 6 日上线:联合李少红、贾樟柯、叶锦添、薛晓路等
快手宣布“可灵AI”导演共创计划作品将于12月6日上线,计划自9月9日启动,由9位导演联合发起,涵盖多种题材。9部短片全部由可灵AI进行视频生成。可灵AI服务用户已超500万,累计生成5100万个视频和1.5亿张图片,商业化单月流水超千万人民币。
全网热评的李飞飞世界生成模型,真的能构建物理世界吗?
李飞飞的空间智能World Labs发布了世界生成模型,一个能从单张图片生成3D物理世界的AI系统,引起AI界热议。该技术突破在于直接生成三维场景,遵循物理规则,具有深度感和空间感,能实现场景控制和动态效果。
2024年12月3日·周二
OpenAI考虑在AI产品中引入广告
OpenAI首席财务官Sarah Friar透露,公司正在考虑将广告引入AI产品中,寻求新的收入来源。目前没有积极推进广告业务的计划,公司对探索其他收入渠道持开放态度。广告经验团队包括曾在Instagram和谷歌搜索广告团队任职的成员。目前,OpenAI主要通过出售AI模型API访问权限、ChatGPT会员收入和与微软合作获得收益。
微信公众号后台新增“AI 配图”功能,支持文章配图和封面配图
微信公众号后台最近推出了“AI 配图”功能,支持创作者通过简单的文字描述在十几秒内生成四张风格和比例可调的候选图片,用于文章配图。极大提高了内容创作的效率,还有效规避了图片版权问题,增强了内容生产的安全性。同时,文章封面图也支持AI配图。
ChatGPT两岁,OpenAI 10亿用户计划曝光!
ChatGPT 已经2岁了!OpenAI下一个目标瞄准十亿用户,预计明年放出AI智能体产品。就在生日这天,马斯克还送上了大礼:阻止OpenAI全面盈利的一份诉状书。
实测腾讯元宝2.0:图文视频啥都能搜,论文绘画全搞定
腾讯元宝2.0 全新升级,集成AI搜索、阅读、生图等功能,打通公众号、视频号等资源,提供深度研究、脑图整理服务。新增创意绘画、灵感图库、AI美照等图片功能,以及应用广场。同时整合腾讯文档、电脑管家、搜狗输入法,提升工作效率和用户体验。
2024年12月1日·周日
张军:腾讯混元大模型 12 月 3 日将上线视频生成能力
腾讯公司公关总监张军宣布,腾讯混元大模型 12 月 3 日正式上线视频生成能力,用户可以在 腾讯元宝 App 中提交申请试用。企业客户通过腾讯云提供服务接入,目前 API 同步开放内测申请。同时,腾讯也将开源该视频生成大模型,参数量 130 亿。
中国石油发布 700 亿参数昆仑大模型,与中国移动、华为、科大讯飞联手打造
中国石油与中国移动、华为、科大讯飞合作发布了700亿参数昆仑大模型。模型展示了43个专业和通用应用创新场景,语言大模型参数从330亿升级至700亿,显著提升了自然语言处理等能力。同时,昆仑大模型构建了我国首个勘探全领域专业大模型,并按需构建了21个场景大模型。
我去华强北走了一圈,发现这里正被另一种AI包围
华强北,中国电子制造中心,正被AI技术包围。市场上出现了AI翻译机、AI吉他、AI手机壳等创新产品。尽管华强北以电子元器件和手机配件为主,但其强大的组装能力为AI硬件创新提供了巨大潜力。
小马智行纳斯达克挂牌上市,摘得Robotaxi第一股
小马智行(Pony.ai)于11月27日在纳斯达克上市,股票代码“PONY”,成为全球Robotaxi第一股。公司计划以每股13美元发行2300万股ADS,融资额可达2.99亿美元,若超额配售权行使,IPO总募资额约4.52亿美元。小马智行自2018年推出Robotaxi服务,技术核心为“虚拟司机”,已与多家车企和出行平台合作,致力于推动自动驾驶技术商业化落地。
2024年11月28日·周四
月之暗面Kimi 联合清华大学等机构,开源共建大模型推理架构 Mooncake
月之暗面 Kimi 联合清华大学等机构推出了大模型推理架构 Mooncake ,项目以KVCache为中心,通过以存换算理念减少算力开销,提升推理吞吐量。Mooncake可以提高大模型在处理任务时的效率和性能,提升推理速度、降低成本、满足处理长文本和高并发需求。就像是为AI模型提供了一个更高效、更省钱的“加速器”,让它们能更好地服务于各种应用,比如智能助手、数据分析等。
《ChatExcel Pro使用教程》上线,3分钟学会用AI Excel解决所有表格问题
元空AI推出的ChatExcel Pro使用教程正式上线,该教程包含Excel处理、数据运算、数据分析和图表生成四大板块,帮助用户通过AI Excel自动化完成工作任务。教程提供练习表格和提示词,用户可通过自然语言描述需求,快速掌握操作。 ChatExcel 支持多表合并、数据查找、逻辑运算等多种功能,大幅提高数据处理速度和准确性。
Hugging Face 发布 SmolVLM 开源端侧AI模型:20 亿参数,体积小、速度快
Hugging Face 于11月26日发布了 SmolVLM AI 视觉语言模型,该模型仅有20亿参数,专为设备端推理设计,具备体积小、速度快和内存高效的特点。SmolVLM 提供三个版本:SmolVLM-Base、SmolVLM-Synthetic 和 SmolVLM-Instruct,全部开源。
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
昆仑万维推出了国内首款具备中文逻辑推理能力的大模型“天工大模型4.0”o1版( Skywork o1 ),包含三款模型,其中开源版本Skywork o1 Open参数为8B,显著提升数学和代码指标,并解锁了数学推理任务。Skywork o1 Lite和Preview版本展现了更快的推理速度和深度思考能力
华为、阿里、美团等大厂都已下场,“具身智能”会成为一场泡沫吗?
华为、阿里、美团等中国科技巨头纷纷投资具身智能领域,推动人形机器人技术发展。尽管市场热度高,但具身智能的商业化进程缓慢,许多产品仍处于试验阶段。专家预测,到2030年全球AI机器人市场规模将超2500亿人民币,具身智能机器人有望在劳动力紧张背景下迎来发展机遇。
2024年11月26日·周二
月之暗面 Kimi 全量上线 k0-math 数学模型,正式推出“Kimi数学版”
据科技自媒体沃垠AI报道, Kimi 全量上线 k0-math 数学模型,正式推出“Kimi数学版”,采用Self-play RL强化学习和Cot思维链技术,擅长解决数学和推理问题,智力程度可比博士。Kimi数学版能理解模糊表达,进行推理或运算,实测9个问题表现出色,包括自媒体粉丝增长计算、双色球中奖概率等。Kimi数学版在MATH测试中得分93.8,超过o1-mini、o1-preview。
中国工程院院士邬贺铨:AI 正在从模型层走向“智能体”,具身智能不等于AGI
邬贺铨认为,上云仅是大模型落地的重要环节,但不是唯一的环节。上云(计算平台)不能完全解决大模型落地,还需要下沉到智能终端,如果终端能自我生成文生图、文生视频,会带动手机的更新迭代。
Runway 获得新技能:更改视频比例,图片拥有“电影级”运镜
视频生成AI公司 Runway 推出“Expand Video”功能,支持用户通过文本提示生成额外内容并调整视频比例,保持视觉效果统一。该功能支持动态摄像效果,如快速变焦和拉远镜头,静态画面更加具有电影感。“Expand Video”将逐步向Gen-3 Alpha Turbo用户开放。
喊着干掉网站和app的AI公司们,却在豪掷数亿疯抢网址域名
AI公司在宣称AI将取代传统网站和应用的同时,却在域名市场上豪掷数亿人民币。OpenAI以1550万美元购得chat.com,欲将“chat”打造为新时代的“google”。安圭拉因拥有.ai域名后缀,从AI创业潮中获益,域名收入占其GDP的10%以上。国内AI公司则通过注册多个备选域名来应对域名争夺战。
2024年11月23日·周六
重磅!OpenAI考虑开发AI浏览器,已聘请2位Chrome浏览器创始人
OpenAI正考虑开发一款结合聊天机器人的AI浏览器,并已与多家网站和应用开发商讨论搜索功能合作。公司还聘请了两位Chrome浏览器创始人,若推出浏览器,将成为Google的直接竞争对手。
谷歌 Gemini 突发试验版模型:重回竞技榜第一,新版 GPT-4o
只领先了 1 天 谷歌与OpenAI的竞争升级,谷歌发布Gemini-Exp-1121模型,超越OpenAI的 GPT-4o 重回竞技榜第一。Gemini-Exp-1121在代码、推理和视觉理解能力上均有显著提升,性能全面领先。同时,OpenAI在ChatGPT测试版中被发现有“实时摄像”视频功能代码,预示着未来交流方式可能转向语音和视觉识别。
李彦宏:百度文库 AI 功能月活用户超 5000 万,同比增长超 300%
百度创始人李彦宏在财报电话会上宣布, 百度文库AI 功能月活用户超5000万,同比增长超300%。第三季度订阅收入同比增长23%。百度文库与百度网盘联合推出“ 自由画布 ”工具,首日吸引超20万人预约。百度还发布了AI原生应用“橙篇”和“AI文档助手”,提供文件理解、总结、问答及文档辅助写作功能。
2024年11月22日·周五
扣子Coze OpenAPI进军智能语音领域,提供音色克隆等功能
扣子Coze OpenAPI进军智能语音领域,提供低延时、定制化、随时打断和音色克隆等功能。该技术整合了扣子强大的智能体生态,支持无限游戏、查询天气新闻、口语练习等多种功能。通过智能语音对话OpenAPI,用户可将智能实时对话能力引入自己的应用,如微信小程序、游戏等。目前正处于内测阶段,可免费申请。
微软发布 AI Shell 工具,为命令行插上 AI 翅膀
微软发布了AI Shell命令行工具,通过AI简化编码、排查错误和自动化工作流程,为开发者和IT专业人员提供智能化的命令行体验。该工具核心包括Azure OpenAI Agent和Copilot in Azure Agent两个AI智能体,支持自然语言查询、代码生成和Azure CLI命令建议。
OpenAI 重夺竞技场第一:ChatGPT-4o 登顶,击败谷歌 Gemini
OpenAI在新加坡开发者日上发布了新版ChatGPT-4o,重点提升了创意写作能力,在竞技场排名中重夺第一。新版4o在创意写作、代码能力和困难任务等方面均有所提升,胜率显著。同时,增加了敏感话题内容政策的护栏功能,确保对话安全。
2024年11月21日·周四
估值超3500亿!马斯克xAI又融资355亿,用于买英伟达GPU
特斯拉CEO埃隆·马斯克的xAI公司在最新一轮融资中筹集了50亿美元,估值达到500亿美元。新资金将用于购买10万块英伟达芯片,扩大其AI数据中心。xAI的核心产品 Grok 聊天机器人年化收入已达1亿美元,计划12月推出更强大的Grok-3版本。
快手 可灵AI 月营收破千万,累计服务超500万用户 快手AI产品
可灵 自6月推出以来,累计服务超500万用户,生成5100万视频和1.5亿图片,月营收破千万。快手在AI领域取得显著成果,快意大模型MoE版本以较少参数量实现优于原1750亿参数模型的性能,降低成本同时适配业务需求。
2024年11月20日·周三
实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍
昆仑万维推出 Skyo 实时语音对话助手,基于天工大模型4.0版打造,具备快速响应、实时打断、情感化反应等功能。Skyo在健康常识、情感化反应、实时资讯获知等方面表现出色,能男女声切换、念诗,展现拟人化属性。该产品将于12月上线天工App,接入天工搜索。
闪极科技获数千万元A轮融资,新品AI拍摄眼镜将于12月19日发布
「闪极科技」完成数千万元人民币A轮融资,光远投资领投,未来光锥前沿科技基金和云天励飞跟投。资金将用于新品“闪极AI拍摄眼镜”的市场拓展、技术研发及人才建设。该产品将于12月19日发布,主打持久续航、高清拍摄、影音质感及AI能力。
阿里发布 Qwen2.5-Turbo:支持百万超长上下文,性能提升显著
阿里通义Qwen2.5系列更新,新增 Qwen2.5-Turbo 支持百万超长上下文,性能提升显著。上下文长度扩展至1M tokens,推理速度提升4.3倍,成本仅为0.3元/1M tokens。在长文本任务中,Qwen2.5-Turbo超越GPT-4o-mini,且短文本性能不减。模型已在HuggingFace和魔搭社区提供Demo,API服务上线阿里云平台。
2024年11月19日·周二
AI 成 华为Mate70 最大卖点?华为预告片剧透三大功能
华为连发三个视频为Mate70系列预热,每一条宣传文案中均带有“Mate有真AI”的标签,引发外界对Mate70系列AI新功能的猜想。三条视频或分别对应三项AI功能: AI手势、AI分身、AI防窥 。这也是华为官宣定档Mate70发布日期之后,首次公开的一系列功能前瞻。
快手可灵 AI API 能力升级:支持 V1.5 输出 1080P 高清视频、开放 V1.0 视频延长功能
快手的 可灵AI 宣布API能力免费升级,推出支持1080P高清视频输出的V1.5高品质模型,相较于V1.0模型,在画面质量、动态效果和文本响应度上均有显著提升。同时,开放V1.0模型的视频延长功能,支持用户续写视频4至5秒,支持多次续写,最长可达3分钟,实现更流畅的场景转换。
闲鱼推出 AI 智能体,已应用于闲置交易全链路
闲鱼近日宣布,已推出闲鱼 AI 智能体,首次将 AI 技术应用于闲置交易领域。据悉,闲鱼 AI 智能体已应用于交易全链路,包括信用体系、智能发布、托管服务、AI 模特试衣和循环商店等。AI 技术也用于提升线下循环商店效率和售后服务,如智能托管和 AI 小法庭,降低了纠纷返单率。
银河通用再获5亿融资,累计融资额超12亿,加速具身智能机器人技术发展
银河通用完成5亿元人民币战略轮融资,累计融资超12亿元。公司专注于轮式双臂通用具身机器人Galbot G1,已在工业、物流、教育等领域落地验证,并与美团等达成战略合作。Galbot G1可以抓取随机堆放、从未见过的透明、高光等物体,甚至已进一步掌握类似开柜子、开抽屉、晾衣服等泛化操作技能。
2024年11月18日·周一
夸克推出“学术搜索”,每次 AI 回答可引用超 10 篇文献内容
夸克 今天宣布上新“学术搜索”AI 产品,依托 AI 技术和亿级学术文献,将大大提高学术工作中信息获取、创作和处理的效率。据官方介绍,夸克与维普、知网等平台共同搭建了总量过亿的专业学术文献题录和全文资料库,夸克学术搜索凭借大模型能力,可以为每次 AI 回答引用 10 篇以上的文献内容,实现多维度的信息归纳和知识整理,确保搜索内容的正确性。
天工大模型4.0 O1版(英文名:Skywork O1)将于11月27日启动邀测
昆仑万维集团宣布,将于11月27日启动 天工大模型 4.0 O1版(Skywork O1)的邀请测试。该模型是国内首款具备中文逻辑推理能力的o1模型,采用4千亿级参数MoE混合专家模型,并将开源。天工大模型4.0 O1版将推动AI领域发展,提升模型复杂推理能力。
通义代码模式正式上线,一句话帮你生成应用
通义千问 的代码模式正式上线,新功能支持用户无需编程知识即可生成应用,支持前端页面、设计素材、生日贺卡、数据图表、小游戏和精美简历等。代码模式背后的技术基于 Qwen2.5-Coder (在多项基准评测中表现优异的开源代码模型)。用户现在可以通过通义官网体验这一创新功能。
OpenAI 桌面版 ChatGPT 应用登陆微软 Windows,支持拍照识别及语音交流
OpenAI 发布了面向 Windows 10/11 用户的桌面版 ChatGPT 应用,支持拍照识别和语音交流。用户可通过快捷键快速访问,上传文件和图片进行问答。桌面版包含网页版大部分功能,但高级搜索和模式需订阅20美元/月的ChatGPT Plus。Windows版还支持截图和自定义快捷键,提供GPT-4o、DALL-E 3等模型。
讯飞星火多模态交互大模型上线,数字人/语音/视觉支持一键全调用
多模态交互大模型正式上线,实现语音、视觉、数字人交互三合一,支持一键调用。模型首发超拟人数字人技术,能精准匹配语音内容生成表情动作,实现跨模态语义一致性,AI情感表达真实连贯。同时支持多模态视觉交互,能全面感知背景场景、物流状态等信息。
谷歌 Gemini 发布苹果 iOS 版 App:集成灵动岛,支持 AI 语音聊天
谷歌推出了专为iPhone设计的 Gemini AI应用,集成了iOS的灵动岛功能,支持用户通过文本或语音与AI进行互动。新应用还带来了Gemini Live功能,用户能在灵动岛和锁屏上直接管理AI对话,无需切换应用。目前,已在澳大利亚、印度、美国和英国等地区上线,国区尚未支持。
2024年11月14日·周四
智谱发布「智谱清流」企业级AI智能体开发平台
智谱推出企业级AI智能体开发平台“ 智谱清流 ”,助力企业AI应用落地。智谱清流提供Agents、Workflow、知识管理等工具,支持API、SDK、URL集成,无需编程即可构建AI应用。平台还提供全程陪跑服务,包括专业咨询和定制AI培训,帮助企业实现业务流程全面AI化。
阿里在海外推出对话式 AI 搜索引擎 Accio,面向全球商家开放
阿里巴巴在海外推出了对话式AI搜索引擎 Accio ,定位全球商家的个人采购代理。Accio通过分析供货商、定制范围、价格等信息,帮助用户筛选合适的商家和商品。试运行期间,转化率提升了20%-30%,商品量已达亿级。Accio支持英语、德语、法语、西班牙语和葡萄牙语。
AI代码编辑器 Cursor 母公司收购 Supermaven
据 TechCrunch 报道,AI 代码编辑器 Cursor 的母公司 Anysphere 收购了AI编程助手 Supermaven ,收购金额未披露。Supermaven 将使 Anysphere 能够推出新版 Tab AI 模型,该模型 “快速、可感知上下文且高度智能”,尤其是在长代码序列方面。Supermaven的插件将继续保留,但 Cursor 将成为团队的核心重点。
2024年11月13日·周三
端侧非自回归图像生成基础模型Meissonic登场,超越SDXL
Meissonic ,一种新型端侧非自回归图像生成模型,其高效、高分辨率的图像生成能力超越了SDXL。该模型通过增强型Transformer架构、先进的位置编码和特征压缩层等技术改进,在图像质量和细节上与领先扩散模型相媲美。Meissonic在8GB显存下即可运行,为中低端显卡用户提供了便利,同时展现了强大的zero-shot图像编辑能力。
百度发布小度 AI 眼镜:全球首搭中文大模型,支持边走边问、第一视角拍摄等
在今日的 2024 百度世界大会上,百度正式发布了小度 AI 眼镜,称该产品为“全球首款搭载中文大模型的原生 AI 眼镜”。据百度官方介绍,小度 AI 眼镜具备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。预计小度 AI 眼镜将于明年上半年正式上市。
Qwen2.5-Coder深夜开源炸场,Prompt编程的时代来了!
通义千问团队开源了 Qwen2.5-Coder 系列,强大且多样化的开源代码模型,包括代码生成、修复和推理等,并在多个基准测试中达到行业领先水平。该系列提供从0.5B到32B的模型尺寸,Qwen2.5-Coder-32B-Instruct在多个基准测试中表现出色,与GPT-4o相当,支持40多种编程语言,并在多语言代码修复上排名第一。
OpenAI大改下代大模型方向,scaling law撞墙?AI社区炸锅了
OpenAI可能正在调整其大模型发展策略,因为最新旗舰模型Orion性能提升不如预期,且面临数据储量耗尽问题。AI行业正转向训练后模型改进,探索新的scaling laws。OpenAI内部对此有争议,一些研究者认为AI发展不会放缓,而其他人则看到了性能提升的递减趋势。
2024年11月12日·周二
Suno发布V4版本音乐生成模型音频演示视频,音质和风格大提升
Suno公司发布了其AI音乐生成模型V4版本的首批音频样本,表示将会很快发布 V4版本模型。新版本模型在自然音效、多样性和一致性方面都有较大改进。官方尚未透露技术规格和新功能, Suno 最近增加了 “角色 ”功能,有助于在生成的多首歌曲中保持音乐风格的一致性。
黄仁勋两万字访谈实录:希望英伟达拥有 5 万名员工和 1 亿个 AI 助手
英伟达CEO黄仁勋在对话中预测,个人AI助手将很快出现并不断进化,未来英伟达将拥有5万名员工和1亿个AI助手。英伟达的使命是构建一个无处不在的计算平台,推动智能向通用人工智能(AGI)发展。黄仁勋认为,AI将改变工作,对人们如何看待工作产生深远影响,而AI的安全和开源模型对行业激活至关重要。
OpenAI押注的1X解锁新场景,人形机器人化身大厨煎牛排
OpenAI押注的机器人公司1X Technologies(简称1X)正式推出专为家庭设计的人形机器人原型NEO Beta(下称NEO)。日前该机器人解锁了新场景——厨房,NEO和网红厨师Nick DiGiovanni进行了一场家庭烹饪对决,比赛做出完美的五分熟牛排。
谷歌 AI 视频编辑应用 Google Vids 上线:帮你写脚本、剪片、找素材等
谷歌宣布正式面向 Google Workspace 用户推出 Google Vids 应用。Google Vids 集成了 Gemini 大模型,可以帮助用户创建幻灯片、编写视频脚本,并从 Shutterstock 寻找素材,还可以为整个视频制作分镜头脚本。
2024年11月9日·周六
Perplexity 即将完成新一轮融资,估值或将达到90亿美元
据 The Information 报道, Perplexity 新一轮融资即将完成,估值将达到 90 亿美元。据悉次轮融资由Institutional Venture Partners 进行领投,投资金额为 5 亿美元。这次融资是 Perplexity 今年的第四轮融资,而 Institutional Venture Partners 此前也多次对该公司进行投资。
小鹏AI机器人来了!身高1米8,用上大模型,已进厂拧螺丝
小鹏汽车在AI科技日上发布了AI机器人Iron,这款1.8米高的机器人拥有62个自由度,手部灵活且具备触觉反馈。采用了小鹏自研的图灵AI芯片和天玑AIOS,已在小鹏广州工厂投入生产小鹏P7+。Iron的设计考虑了人类生理特征,提高用户和社会的接受度。
消息称王慧文回归美团,带队独立探索 AI 应用
《智能涌现》援引多个独立信源报道,原美团联合创始人、光年之外创始人王慧文如今已经回归,在美团带队探索 AI 应用。王慧文所在的美团 AI 团队被称为 GN06。该团队目前的主要业务方向包括情感陪伴、聊天机器人等。GN06的主要产品之一,是在2023年11月上线的AI情感陪伴产品 Wow 。
达摩院发布八观气象大模型:精度达1小时1公里,率先落地新能源场景
阿里巴巴达摩院发布八观气象大模型,时空精度达1小时1公里,提升新能源电力系统预测性能。模型融合多源数据,提高辐照度、风速等气象指标预测精度,助力国网山东电力调控中心应对极端天气,提升新能源发电功率和电力负荷预测准确率至96%和98%以上。
2024年11月8日·周五
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
昆仑万维集团发布 天工 AI高级搜索功能,提供金融投资和科研学术领域的专业搜索体验。通过升级推理能力、金融投资和科研学术专业搜索,以及文档AI阅读分析的优化,实现精准、高效的问题解答。
Perplexity CEO 最新洞察:AI 产品除订阅还有许多变现路径,API 成本每半年减少 50%,未来将专注增长
Perplexity CEO 在TechCrunch Disrupt上讨论了AI搜索的未来和产品策略。他强调 Perplexity 将根据用户需求开发功能,替代传统搜索引擎。商业化方面,他提到AI行业运营成本高昂,但API成本正下降,Perplexity将探索灵活的广告变现模式,并推出Perplexity Publisher Program,通过广告收入分享和定制AI助手,帮助媒体和内容创作者参与AI搜索生态。
马斯克的xAI放大招了!Grok API开启公测,每月25美金免费额度,人人可参与
马斯克的xAI公司推出了Grok API公测,提供每月25美元的免费额度。新模型grok-beta性能提升,即将推出多模态版本。预付费用户将获得额外免费额度。xAI API兼容OpenAI和Anthropic SDK,易于迁移。开发者可在console.x.ai注册参与公测。
估值超140亿、OpenAI贝佐斯下场,这家让机器人装AI“大脑”的公司获28亿新融资
利用AI技术帮机器人造“大脑”的美国独角兽公司物理智能(Physical Intelligence)宣布完成4亿美元(约合人民币28.39亿元)融资。本轮由亚马逊创始人Jeff Bezos、风险投资公司Thrive Capital和Lux Capital领投,其他投资者包括OpenAI、Redpoint Ventures和Bond,投前估值达20亿美金(约合人民币141.94亿元)。
15岁山东初中生做CTO,开源项目刚刚被数百万元收购了
15岁山东初中生zmh成为CTO,其开源项目ChatNio被数百万元收购。项目集成了多个AI模型,提供全面服务,包括chatbot、图像生成等,并以高性价比获得超过10万月活用户,实现每月约5万净利润。zmh虽年轻,但已拥有7年项目开发经验,技能涵盖全栈开发、网络安全等领域。
Meta公布机器人触觉感知研究成果:用手指传感器结合“AI大脑”理解/操作外界物体
Meta 发布新闻稿,介绍了旗下 FAIR(基础人工智能研究)团队对于机器人触觉感知能力的研究情况,这项研究旨在让机器人通过触觉方式进一步理解和操作外界物体。团队目前开发的机器人触觉感知能力主要就是为了让机器人检测其交互的物体的材质与触感,让 AI 判断机器人应当如何操作这些设备(例如拿起鸡蛋等场景)。
2024年11月3日·周日
首关15亿元,中国大模型独角兽智谱AI要学美国OpenAI当基金LP
智谱边找钱、边撒钱,当起“攒局者”。截至目前,智谱Z计划已累计链接1200+大模型初创项目,其中投资超过20家、孵化超过30家企业。11月1日消息,国内大模型独角兽公司智谱AI宣布,领衔并联合石景山现代创新产业发展基金、奥飞数据、燕北资本、复琢投资等设立的风险投资基金“Z基金”(智谱生态基金)于近期完成首关,管理规模15亿元人民币,投资方向主要覆盖大模型赛道,侧重早期。
知乎直答新功能上线,「专业搜索」带来更高效的知识获取方式
知乎AI搜索产品 知乎直答 正式上线“专业搜索”功能,引入维普、知乎精选等专业内容源,涵盖超过5000万篇中英文文献数据,极大满足广大用户对于高质量信息的需求。同时,知乎直答“专业搜索”支持文件上传和超长文件解析,并针对提供单篇精读、指定来源问答等功能,更加契合专业人士的生产力场景。
正式挑战谷歌!OpenAI上线ChatGPT搜索功能
搜索功能先上线付费版ChatGPT Plus和Team,未来几个月内面向所有免费用户;搜索模型为GPT-4o微调版本,后训练得到o1-preview输出支持; ChatGPT 可根据用户询问搜索网络,用户也可点击搜索图标手动搜索;提供天气、体育比赛、股票、地图等搜索信息,聊天时得到的搜索信息提供来源侧边栏。
继 ChatGPT 后,Anthropic 旗下 Claude AI 推出桌面客户端
继 ChatGPT 后,目前又有一款海外流行的人工智能 Claude AI 发布了桌面版客户端,目前相关客户端处于测试状态,支持 Windows / macOS / iOS 平台。Anthropic 在 X 平台官宣了这一消息,同时透露用户可以使用热键快速唤起客户端界面,不过 Claude AI 客户端定位 AI 搜索引擎,与 OpenAI 的 ChatGPT 客户端聊天有所差异。
2024年11月2日·周六
苹果最强AI PC登场!首搭M4 Max芯片,续航飙到24小时
苹果M4系列MacBook Pro终于来了!与上一代相比,新款MacBook Pro的外观几乎没有变化,价格仍为12999元起。其中的重点更新就是全系搭载M4系列芯片、支持苹果AI,并首搭雷雳5接口、纳米纹理显示屏以及支持视频人物居中的1200万像素前置摄像头,续航最长达到24小时,30分钟就能充一半电。
百川智能推出一站式大模型商业化解决方案
百川智能推出一站式大模型商业化解决方案,即1+3产品矩阵(全链路优质通用训练数据,Baichuan4-Turbo、Baichuan4-Air两款模型和全链路领域增强工具链),该方案支持企业将专有数据与百川智能自用的全链路训练数据混合,对Baichuan4-Turbo、Baichuan4-Air两款模型进行调优和增强,实现了96%多场景可用率。
OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台,对话更自然 OpenAI
ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。OpenAI 表示,AVM 提供了更自然、实时的对话体验,能够实时感知和回应用户的情绪。
2024年10月30日·周三
豆包正式开放视频生成内测申请入口,用豆包电脑版可加速审核
豆包正式开放视频生成内测申请,图片文字一键成片。豆包视频生成具备出色的语义理解能力,能将信息转化为生动逼真的视频内容。支持酷炫的动态和运镜,多镜头保持一致,风格比例随意挑选。官方提示使用 豆包电脑版 可加速审核。
中国AI应用10月广告投放超3亿元,中美 AI 大模型开始“分道扬镳”
2024年,中国、美国之间的 AI 大模型竞赛不再只是“追赶”,而是开始各不相同:中国AI大模型“卷”算力、“卷”价格,而且“卷”获客、“卷”变现能力;美国 AI 专注于前沿 AI 模型技术研究,并且加速 AI 应用和落地。钛媒体独家获悉,截至10月29日, Kimi智能助手 、字节跳动 豆包 、腾讯元宝等所有 AI 应用10月全网广告投放(投流)支出超过3亿元人民币。
阿里巴巴国际站推出升级版AI外贸产品:AI生意助手2.0
阿里巴巴国际站推出升级版AI外贸产品: AI生意助手2.0 ,包含四个AI Agent,覆盖发品、接待、营销和合规等外贸经营难点,旨在提升转化率和创造增量生意。AI助手能实时洞察买家需求,提供个性化服务,全球已有超6万中小企业使用。总裁张阔预测,未来外贸将全面AI化,80%的新增商业价值将在AI驱动下重新分配。
围攻谷歌!Meta秘密训练AI搜索引擎8个月,苹果与OpenAI发力
据The Information报道,Meta正在秘密研发一款自己的AI搜索引擎,旨在提升其Meta AI聊天机器人的搜索能力,并减少对谷歌和微软两大科技巨头的依赖。据报道,该项目已经持续了8个月,目标是为Meta AI聊天机器人提供独立的时事信息检索服务,降低因与苹果、微软等公司外部协议变动所带来的潜在风险。
2024年10月29日·周二
爱诗科技正式发布PixVerse V3,新增创意模板、对口型、视频延长等功能
爱诗科技正式发布了 PixVerse V3 ,具备多模态生成能力,包括创意模板、对口型、故事续写和风格转换。能精准理解提示词,生成有情感和质感的视频,实现现实与虚拟的融合。PixVerse V3支持多种视频比例和风格化功能,新增对口型功能,能自动适配视频中人物的口型。Effect功能提供了8个创意效果,支持类似Pika的“捏爆”特效。
MiniMax:7000万美金营收下的甜蜜和隐忧
MiniMax的AI应用Talkie在海外市场表现出色,预计年收入超过7000万美元,成为公司主要收入来源。Talkie自2023年6月上线以来,迅速占据全球陪伴类AI应用下载量前三,吸引大量用户并实现高付费率。尽管国内版本“ 星野 ”未能复刻其成功,MiniMax仍计划拓展东南亚市场,以应对营收来源单一的风险。
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney
神秘文生图模型”red_panda”(小熊猫)近日走红,其ELO得分超过Flux 1.1 Pro,胜率高达79%,每7秒生成一张图像。该模型无人认领,引发广泛猜测,可能来自中国厂商或Midjourney V7等。量子位进行了实测,red_panda在竞技场中表现强劲,但并非压倒性胜利。
2024年10月28日·周一
谷歌 DeepMind 开源 SynthID Text 工具,可辨别 AI 生成的文字
谷歌DeepMind开源了SynthID Text工具,这是一个可以辨别AI生成文字的水印工具。SynthID Text通过分析文本中特定Token的概率分数来识别AI生成的内容,不影响输出质量和准确性。谷歌DeepMind的SynthID-Text文本水印技术登上Nature杂志封面,并已开源。
Claude AI 上线新工具:分析、可视化 CSV 文件中的数据
报道称 Anthropic 公司在更新 Claude 3.5 Sonnet 并推出全新的 Claude 3.5 Haiku 后,还推出了全新的分析工具,可以编写和运行 JavaScript 代码,实现处理数据、进行分析并生成实时洞察。此分析工具将作为 Claude.ai 的新内置功能提供,类似于 ChatGPT 的代码解释器,它能够编写和运行 JavaScript 代码,处理数据、进行分析并生成洞察。
MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品
AI 大模型领域的独角兽MiniMax将于今年11月发布对标GPT-4o的 Realtime API 服务,将提升端到端实时多模态处理能力,并带来更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交、直播、游戏等多种场景提供服务。内部正在打磨这款产品,并非常希望11月发布时产品效果直接对标OpenAI GPT-4o 。
全球最强模型:OpenAI 被曝 12 月推出 Orion,AI 性能百倍级跃升
科技媒体 The Verge 今天(10 月 25 日)发布博文,报道称 OpenAI 计划今年 12 月推出代号为“Orion”的新款前沿模型。虽然在 OpenAI 内部,Orion 被视为 GPT-4 的继任者,但尚不清楚公司是否会在外部称其为 GPT-5。OpenAI 高管曾透露“Orion”要比 GPT-4 强大 100 多倍。
2024年10月25日·周五
快手:可灵AI用户已超360万,独立App即将上架
2024中国计算机大会上,快手副总裁、大模型团队负责人张迪介绍,自今年六月发布以来, 可灵AI 已有超过 360 万用户,累计生成 3700 万个视频和超过一亿张图片。近期可灵AI还将上架独立App,方便用户使用。
讯飞星火 4.0 Turbo 大模型发布:七大能力全面超越
GPT-4 Turbo 在今日上午的 2024 科大讯飞全球 1024 开发者节上,科大讯飞正式发布“ 讯飞星火 4.0 Turbo ”。讯飞星火 4.0 Turbo 号称迎来全新升级,七大能力全面超越 GPT-4 Turbo,数学能力、代码能力超过 GPT-4o。讯飞星火 4.0 Turbo 已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类 o1 的高难度数学能力。
智谱与中国三星官宣战略合作:AI 手机与 GLM 大模型相结合
中国三星与智谱华章(简称“ 智谱 ”)昨日宣布战略合作,双方称将在 AI 手机领域展开深度共创,共同打造卓越体验的 AI 产品。近期高通宣布与智谱合作,为骁龙 8 至尊版适配优化 GLM-4V 端侧视觉大模型,支持丰富的多模态交互方式。
AI手机看荣耀:荣耀MagicOS 9.0正式发布,开启手机自动驾驶新时代
荣耀在MagicOS 9.0发布会及开发者大会上正式发布行业首个搭载智能体的个人化全场景AI操作系统——MagicOS 9.0,推出全新自研魔法大模型家族,并宣布YOYO助理正式升级为YOYO智能体。发布会上,荣耀全新智能体商店正式上线,YOYO智能体将携手百模生态,共创智能新世界。
用光学让AI算力集群提速数十倍,Lightmatter融资4亿美元
一家专注于光子计算的公司Lightmatter已经将芯片互连速度提高到30Tbps,100Tbps的版本也在路上。它有光子计算单元,有光学芯片封装和传输技术,能够系统化提升整个AI计算集群的计算力,计算效率,并降低功耗。近日,Lightmatter获得了4亿美元的D轮融资,累计融资金额达到8.5亿美元。
2024年10月23日·周三
Anthropic 推出升级版 Claude 3.5 Sonnet 模型,可操控用户电脑 Claude 发布新版本的 3.5 Sonnet 和新发布的 3.5 Haiku ,能力都有大进步。这次 Claude 发布了一个重磅新功能——一个新的「计算机使用」API,该模型可以模拟按键、按钮点击和鼠标动作,实质上模拟了一个人坐在电脑前的操作。开发者现在可以通过 API 指导 Claude 像人类一样操作计算机, 包括观察屏幕、移动鼠标、点击按钮和输入文字。
2024年10月22日·周二
Midjourney 下周上线新图像编辑器:让“二创”AI 图片变得更简单
首席执行官 David Holz 昨日在 Discord 平台宣布,将于下周为 Midjourney 推出全新的 AI 图像编辑器工具。用户上传图像后可展开包括放大、缩小、调整角度等多种操作,这些操作不再需要 Discord,只需简单命令即可完成;用户可以使用数字画笔进行修补,进行更精细的修改。
高通发布骁龙8至尊版,AI大模型联手腾讯智谱,小米15抢首发,荣耀剧透新机
高通发布了新一代旗舰手机SoC骁龙8至尊版和第二代高通Oryon CPU,AI性能的大幅提升。骁龙8至尊版采用台积电第二代3nm工艺,CPU性能提升45%,功耗降低40%,AI功能增强。高通还宣布与腾讯混元和 智谱AI 合作,将大模型部署在骁龙8至尊版手机上。小米15系列将首发该芯片,荣耀Magic7系列也将搭载。
商汤CEO徐立发布十周年内部信,提出“三位一体”新战略成为AGI算力+模型服务商
商汤科技董事长兼首席执行官徐立今天发布一份题为《商汤十周年再出发:专注聚焦、知行合一》的内部信。徐立首次提及公司最新确立的“大装置-大模型-应用”的三位一体战略,同时宣布将围绕战略和核心资源,将构建更加集中和高效的组织架构,加快组织和管理的轻盈化进程。
马斯克的 xAI 正式发布 API,开发者可将 Grok 集成到其他应用
埃隆・马斯克的人工智能公司 xAI 正式发布了其应用程序编程接口(API),允许开发者将 Grok 集成到其他应用程序中。目前,API 只有一个模型,名为“grok-beta”,其价格为每百万输入 token 为 5 美元(约 35.6 元人民币),每百万输出 token 为 15 美元(约 107 元人民币)。
微软一口气发10个商业智能体!内测提高9.4%销售收入,六成500强企业在用Copilot
微软宣布推出10个新的商业智能体,涵盖销售、服务、财务、供应链等领域,提高业务效率。这些智能体能自动执行任务,如筛选潜在客户、监控供应商表现等。目前,60%的财富500强企业已使用 Microsoft 365 Copilot 。微软还计划下月开启Copilot Studio公测,允许用户创建自主Agent,以进一步降本增效。
2024年10月21日·周一
一年估值增14倍!AI搜索初创公司Perplexity拟融资5亿美元
据知情人士透露,借助OpenAI最新巨额融资的势头,利用市场对人工智能初创公司高涨的热情,人工智能搜索初创公司 Perplexity 已经开始了新一轮的融资谈判,目标是将其估值提高一倍以上,达到80亿美元甚至更多。
北京新增12款已完成备案的生成式人工智能服务
根据《生成式人工智能服务管理暂行办法》,截至10月21日,北京市新增12款已完成备案的生成式人工智能服务,累计已完成94款生成式人工智能服务备案。已上线的生成式人工智能应用或功能,应在显著位置或产品详情页面,公示所使用已备案的生成式人工智能服务情况,注明模型名称、备案编号。
2024年10月18日·周五
Windows版ChatGPT正式发布!直接用上最强o1,快捷键即可召唤
OpenAI 宣布推出 Windows 桌面应用,向 ChatGPT Plus、Enterprise、Team 和 Edu 用户开放 。不过,官方表示,目前开放的只是早期版本,将在今年晚些时候向所有 ChatGPT 用户推出「完整的体验」。用户可以在微软应用商店搜索 ChatGPT,接着下载安装即可,安装包大约 110MB 。
.ai 域名卖爆,小岛安圭拉 2023 年意外躺赚 3200 万美元
随着人工智能产业的火热,AI 域名也成为了新的热门,包括 .ai 后缀等自然是交易重点。据美联社 10 月 16 日报道,.ai 域名卖爆也为加勒比海的一个小岛 —— 安圭拉带来了一笔横财。借着 .ai 域名的注册、卖出等,安圭拉 2023 年从网络域名注册费中获得的收入翻了两番,达到 3200 万美元(备注:当前约 2.28 亿元人民币)。
OPPO 发布 ColorOS 15 系统,推出一键问屏等AI功能
在今天的 2024 OPPO 开发者大会上,OPPO 正式发布 ColorOS 15 系统,并发布一系列新的功能。ColorOS 15 将上线 超级小布助手功能,一键问屏、一拍即问、一圈即搜、图片问答、文档问答等多种交互方式。ColorOS 15还能深度理解并分析屏幕,基于对上文的理解,像真人一样进行多轮连续的自然对话。
联想推出PC个人智能体AI Now,基于Meta Llama模型
联想在创新科技大会上发布了多项AI产品,包括个人AI智能体 AI Now 、液冷服务器等。黄仁勋、苏姿丰等科技巨头CEO出席,英特尔与AMD宣布首次合作。联想AI Now智能体具备内容无缝传输、个性化内容生成、教育辅助、智能模式调整、设备间智能分享以及跨设备AI功能流转等多项智能化服务。
2024年10月17日·周四
零一万物新旗舰模型 Yi-Lightning,性能超越 GPT-4o
零一万物发布了新旗舰模型 Yi-Lightning ,该模型在国际权威盲测榜单LMSYS上超越了硅谷知名大模型,排名世界第六,中国第一。Yi-Lightning已上线开放平台,每百万token仅0.99元。李开复强调,零一万物将继续大模型预训练,并在To B和To C端均有产品布局。
火山引擎发布大模型训练视频预处理方案,已应用于豆包视频生成模型
火山引擎在视频云技术大会上发布了大模型训练视频预处理方案,助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于 豆包视频生成模型 。
Adobe 推出 AI 头脑风暴工具:激发无限灵感,让创意自由飞翔
科技媒体 Maginative 发布博文,报道称在年度 MAX 会议上,Adobe 预览推出了 Project Concept 项目,是一款基于 AI 的创意头脑风暴工具。该工具的目标是生成更快速、更富想象力和更具协作性的创意,让设计师能够专注于探索更广泛的创意可能性。
Adobe推出文生视频AI模型,向OpenAI和Meta发起挑战
在Adobe MAX年度大会上,这家美国电脑软件公司宣布,它已经开始对一种文生视频人工智能(AI)模型进行公开测试。这项技术被称为 Firefly视频模型 ,Adobe称其技术取得了新的突破,将与OpenAI于今年早些时候推出的文生视频大模型Sora展开竞争。
Anthropic CEO万字长文预言:AGI将有望治愈癌症、倍增寿命
Anthropic CEO Dario Amodei预测,到2026年,AGI的智力将超越人类诺奖得主。尽管AGI不会立即转化为生产力,但它将加速生命科学发展,有望在未来7-12年内治愈大多数癌症,将人类平均寿命从75岁延长至150岁。这标志着“压缩的21世纪”的到来,预示着人类社会将迎来翻天覆地的变化。
2024年10月14日·周一
智谱AI宣布开源文生图模型 CogView3-Plus-3B,采用Apache 2.0协议
智谱AI宣布开源其先进的文本到图像生成模型 CogView3-Plus-3B 。基于最新的DiT框架,通过Zero-SNR扩散噪声调度和文本-图像联合注意力机制,提升了图像生成的质量和灵活性。CogView3-Plus-3B支持从512到2048像素的多种分辨率生成,其性能与业界领先模型相媲美。
优必选发布全新一代工业人形机器人 Walker S1
据优必选官方消息,优必选发布了全新一代工业人形机器人 Walker S1,并已进入汽车工厂实训。Walker S1与L4级无人物流车、无人叉车、工业移动机器人和智能制造管理系统协同作业,这也是全球范围内首个人形机器人与无人物流车等协同作业的工业场景解决方案。
马斯克刚进军Robotaxi,小马智行获广汽投资2700万美元
马斯克发布特斯拉Robotaxi的同一天,中国知名Robotaxi独角兽获得了新认可。广汽宣布,要给小马智行投资2700万美元,相当于人民币1.9亿元。从2016年成立到今天,小马智行已经收获了十多轮融资,累计资金超过11亿美元(约78亿元),完成D轮融资后,估值达到85亿美元(约600亿元)。
深势科技完成数亿元新一轮融资,AI for Science获国资认可
近日,深势科技再获数亿元人民币融资,投资方为北京市人工智能产业投资基金和中关村科学城公司。此次获得国资加持,标志着深势科技在AI for Science领域的深耕、阶段性成果及未来的发展,得到更有力和充分的认可。深势科技是“AI for Science”科学研究范式的引领者和践行者。
2024年10月9日·周三
智谱清言鸿蒙版 App 上线:支持多轮对话、写作辅助、代码生成等功能
智谱清言 今日官宣,第一时间完成所有基础功能与纯血鸿蒙适配,现在所有升级至 HarmonyOS NEXT 的用户均可体验智谱清言大模型。据介绍,智谱清言鸿蒙版 App 已支持多轮对话、写作辅助、代码生成、AI 搜索、AI 画图等功能,同时还支持 50 万个智能体被创建等功能。
字节跳动豆包智能硬件 Ola Friend 预热,预计为智能耳机
字节跳动豆包小红书官方号发布预热海报,配文为 “字节跳动豆包的智能硬件?”,10 月 10 日上午 11 点将公布更多信息。消息称字节 AI 硬件团队的第一款产品为智能耳机,该款耳机将植入豆包大模型,并与字节 2023 年 8 月上线的对话类 AI 应用 豆包 App 结合:戴上智能耳机后,用户可通过语音对话随时使用豆包,在豆包 App 上也可以操控这款耳机。
2024诺贝尔物理学奖,授予AI先驱 Geoffrey Hinton 和 John Hopfield
2024年诺贝尔物理学奖授予了John J. Hopfield和Geoffrey E. Hinton,表彰他们在利用人工神经网络实现机器学习方面的奠基性发现和发明。两位科学家将平分1100万瑞典克朗(约合745万元人民币)的奖金。他们不仅推动了计算神经科学的发展,还为深度学习技术的广泛应用奠定了基础,包括在语音识别和图像识别等领域的突破。
猫眼“神笔马良”上手体验:生成分镜效率高,角色识别有短板
猫眼娱乐发布了首个面向长剧本解析的动态故事板AI生成工具“ 神笔马良 ”。据了解,“神笔马良”可对用户上传的剧本进行一键智能分析、智能角色创作、智能分镜创作、智能台词朗读,全方位视听化呈现剧本内容。
2024年10月8日·周二
OpenAI 推出全新写作、编码工具 ChatGPT Canvas,将免费开放 OpenAI
宣布推出全新写作、编码工具 Canvas ,这是一个与 ChatGPT 合作编写和编码项目的新界面,超越了简单的聊天。ChatGPT Canvas 可以更好地了解任务的上下文,用户可以突出显示特定部分,以准确表明希望 ChatGPT 关注的内容。用户也可以直接编辑文本或代码,要求 ChatGPT 调整写入长度、调试代码并快速执行其他操作。
OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术
OpenAI 在旧金山开发者大会(DevDay)上,发布了 Realtime API ,可以让开发者调用该 API 在第三方应用中集成语音合成技术。OpenAI 表示开发者通过调用新的 Realtime API,可以在其应用中添加 6 种 AI 语音。
智谱 AI 宣布 10 月最低 1 折开放全部官方模型 API,每位用户免费领 1 亿 tokens
智谱 AI 推出 10 月最新促销活动,最低 1 折调用开放平台 bigmodel.cn 所有官方模型 API,期间每位用户均可获赠 1 亿 tokens 额度。此外,在 10 月内,根据用户前一天的 token 用量,次日可享阶梯折扣。
2024年9月27日·周五
美图公司旗下MOKI全面开放,重塑AI短片创作工作流
美图公司旗下AI短片创作工具 MOKI 于9月26日全面开放,用户可通过官网体验。MOKI专注于AI短片创作,支持动画短片、网文短剧等多种视频内容生产。用户只需输入故事梗概或导入脚本,MOKI便能自动生成分镜脚本和画面,并一键生成带配乐的视频。
1.9 亿月活、260 亿估值的Canva,想借助 AI,挑战 2300 亿的 Adobe
Canva ,一个拥有1.9亿月活用户和260亿美元估值的在线设计平台,正借助人工智能技术,挑战市值2300亿美元的Adobe。Canva通过收购AI初创公司Leonardo.Ai和Photoshop竞争对手Affinity,进军办公领域,与Adobe争夺企业市场。Canva CEO Melanie Perkins认为AI工具旨在提高效率,与Canva的使命一致,公司目标是在未来几年内达到10亿月活跃用户。
2024年9月26日·周四
国产具身智能新突破:蔚蓝科技发布多模态AI机器狗BabyAlpha A2
国产具身智能公司蔚蓝科技发布新品:四足机器狗BabyAlpha A2、开发者版本机器人及人形机器人。BabyAlpha A2具备定制化领养、多模态AI交互、AI绘本和共享相册功能,预计10月中旬上市。公司采用线上线下全渠道销售,产品已遍布全国并拓展海外市场。
空间智能公司「极佳视界」连获三轮融资,要将视频生成提升至4D世界模型
空间智能公司「极佳视界」近日宣布完成近5000万元天使及天使+连续两轮融资,此两轮融资由北汽产投、奇绩创坛、华民投、龙鼎投资、清智资本、PKSHA Algorithm Fund等知名财务和产业投资机构投资。此前极佳视界已完成数千万元的种子轮融资,由辰韬资本投资。
重庆特斯联冲刺AIoT第一股!3年29亿营收,超六成来自AI产业数智化
据报道,重庆特斯联科技集团提交招股书,拟在港上市。三年营收29亿,2023年超10亿,六成来自AI数智化。产品遍及全球150城,服务800客户。研发投入占比高,团队庞大,专注智慧城市、AI大数据。主营业务基于操作系统TacOS,涵盖AIoT多领域。
OpenAI CTO和两位技术大咖都跑了!据悉董事会要给CEO奥特曼7%股权
就在OpenAI首席技术官(CTO)米拉·穆拉蒂(Mira Murati)官宣辞职后不久,公司CEO奥特曼(Sam Altman)再投下一枚重磅消息:奥特曼以公开信方式在推文中宣布:OpenAI后训练研究副总裁Barret Zoph、首席研究官Bob McGrew也宣布离开公司。
Meta发布AR眼镜Orion 该品类有望成为下一个10亿级消费电子产品
在9月25日于加州Menlo Park举办的年度开发者大会上,Meta的CEO扎克伯格展示名为Orion的AR眼镜原型产品,Orion是Meta首款“全功能”原型AR眼镜,使用一个腕带组件来接收用户的神经信号,让他们用大脑来控制Orion,这项技术源于该公司2019年收购CTRL-Labs。
Hugging Face 推出 HuggingChat 原生macOS客户端
据 HuggingFace 官方消息,HuggingFace推出了专为macOS用户设计的 HuggingChat 原生客户端。HuggingChat支持本地使用语言模型,同时集成了Markdown、网页浏览、代码语法高亮等实用功能。HuggingChatOS客户端为macOS用户提供了一个无缝且直观的高级AI对话体验。
2024年9月25日·周三
ChatGPT高级语音助手正式上线!OpenAI:50多种语言、9种声线可选
OpenAI周二(24日)宣布,所有付费订阅ChatGPT Plus和Team计划的用户,都将可以使用新的AVM功能(高级语音模式),不过该模式将在未来几天逐步推出。它将首先在美国市场上线。下周,该功能将向OpenAI Edu 和Enterprise 计划的订阅者开放。据悉,AVM提高了部分外语的对话速度、流畅度并改进口音。
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
据谷歌官方消息,谷歌今天发布了旗下两款大模型产品Gemini-1.5-Pro-002 和Gemini-1.5-Flash-002的最新版本。据悉,新模型更快、更强大,也更具成本效益。更新之后的两款模型在数学、代码生成、长文本上下文和视觉任务上的性能提升显著。
腾讯发布轮足式机器人!能照顾老人,还会自我收纳
腾讯发布了Robotics X实验室的最近研发进展,推出了机器人“小五”。小五集合了此前多代机器人研发的核心能力,可以在真实人居环境中完成行走、搬运物体等动作,处理复杂任务,与人进行交互。在腾讯Robotics X实验室展示的小五进入养老院服务老人的场景中,它可以轻轻把老人从床上抱到轮椅上,还可以推着轮椅送老人去参加活动,途中还会注意躲避障碍。
美团再投人形机器人公司宇树科技,80亿估值能否撑起“中国版Figure AI”?
宇树科技近期完成数亿元人民币C轮融资,由北京机器人产业投资基金等机构领投,美团龙珠、中关村科学城、琥珀资本、上海科创基金、红杉资本中国、中信证券、祥峰投资中国基金等参与投资。这是美团第二次参与宇树科技的投资。此前,王兴领导的美团战投参与了宇树科技今年2月的B2轮总计10亿元融资。
2024年9月24日·周二
OpenAI 奥特曼(Sam Altman)罕见发长文:超级AI可能在几千天内实现
9月24日凌晨,OpenAI CEO 奥特曼(Sam Altman)罕见地发表了一篇长文博客,标题为《智能时代》(The Intelligence Age),推特浏览量已经突破了100万人次。奥尔特曼认为,技术进步将使未来几代人能够完成前人认为不可能的事情。AI 将成为解决难题的工具,帮助我们构建新的支撑结构。人人拥有一支 AI 团队将成为可能,能够提供个性化指导和创造。他还做出预测,超级 AI 有可能在未来几千天内完
2024年9月23日·周一
PixVerse 全新 UI 正式发布,新增万能创作浮板、灵感库、创意工作台等功能
PixVerse 全新 UI 正式发布,新增万能创作浮板、灵感库、创意工作台等功能 PixVerse 正式发布全新用户界面,带来万能创作浮板、灵感库、创意工作台和更佳设备兼容性。新界面让视频创作更便捷,支持一键套用模板,高效管理视频,并在多平台上提供流畅体验。
最癫AI社交App “SocialAI” 上线3天爆火!国区可下载
SocialAI 是一款由 Friendly Apps 公司开发的 AI 社交网络应用,它模拟了一个社交媒体平台,所有互动均来自 AI 机器人。用户可以发布状态更新,从 AI 追随者那里获得定制化的回复和互动。根据网友分享的试玩体验,它能让你成为世界的主角,注册就送百万粉丝,但全都不是真人,随便发什么帖都有大批机器人回复点赞。
2024年9月11日·周三
字节再试硬件:探索 AI 耳机、眼镜等产品,与豆包大模型联动
据晚点 LatePost 报道,字节正在探索将大模型与硬件结合,既自己开发 AI 硬件,也会与外部硬件公司合作。据称字节 AI 硬件团队的第一款产品为智能耳机,该款耳机将植入豆包大模型,并与字节对话类AI应用 豆包 App 结合:戴上智能耳机后,用户可通过语音对话随时使用豆包,在豆包 App 上也可以操控这款耳机。
曝 OpenAI 神秘大模型 “草莓” 两周内发布!
据外媒The Information昨晚报道,OpenAI的新模型“草莓”(Strawberry),将在未来两周内作为 ChatGPT 服务的一部分发布。“草莓”项目是OpenAI盛传已久的神秘Q*模型,据传是此前OpenAI政变大戏的关键原因之一。它展现出了解答数学问题、复杂编程的强大能力,让AI安全的研究人员都为之震惊。
面壁智能联合梧桐科技,端侧大模型支撑智能座舱
面壁智能宣布,成为梧桐科技芯算一体 AI 座舱方案中端侧大模型重要合作伙伴,以 MiniCPM 车载多模态大模型实现舱驾协控相关的功能控制。这也是面壁 MiniCPM 端侧多模态模型首次支撑汽车智能座舱的系统底座。梧桐科技已与 10 余家主机厂伙伴,合作超过 100 余款各类车型,覆盖自主品牌、合资品牌、豪华品牌,产品装机量已超过三百万辆。
2024年9月10日·周二
317笔融资告诉你,谁是中国AI投资之王?
虽然AI领域存在很多非共识,但作为这两年最确定的机会之一,仍然有不少投资机构逆势下注AI产业。根据IT桔子数据,今年以来(1月1日~8月27日),国内AI领域发生317笔融资,其中出手三次及以上的投资机构共有38家。在出手三次及以上的38家机构里,有产业背景的投资机构多达14家,占比超过35%。此外,VC、地方产业基金和PE的数量分别为13家、7家以及4家。
美国商务部公布新规要求AI公司报告模型训练进展,声称将阻止外国使用美国技术
美国商务部BIS表示,开发者须每三个月报备,使得政府必须准备好采取行动,确保美国公司生产的军民两用基础模型可供国防工业使用。美国商务部长吉娜·雷蒙多(Gina M. Raimondo)表示,AI 迅速发展,它既有巨大的希望,也有巨大的风险。她表示,草拟规则将帮助美国商务部跟上 AI 技术的新发展,以加强美国国防和维护国家安全。
AI超级周期才刚刚开启!AMD苏姿丰:将加速推出AI芯片
AMD首席执行官苏姿丰(Lisa Su)发表讲话称,人工智能的超级周期才刚刚开启,而AMD将瞄准英伟达的市场主导者地位,加速推出高性能人工智能芯片。在高盛举办的一场通信和技术会议上,苏姿丰表示:“人工智能是一个比我五年前预期的更大的周期,我们现在正为未来五年下大赌注。”
苹果刚刚发布史上首台 AI iPhone,最大亮点是按键
库克又一次在 Apple Park 讲出这句经典开场白。和往年不一样的是,库克首次在发布会开场同时提到 Apple Intelligence 和 Machine Learning 这些词汇,由此可见今年苹果对 AI 的重视。全新 iPhone 16 系列,也是苹果第一个真正意义上的 AI iPhone。
2024年9月9日·周一
快手可灵AI启动中国首个AIGC导演共创计划
快手宣布正式启动“ 可灵AI ”电影共创计划,联合李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位导演共同推出9部AIGC电影短片。据介绍,9部短片将全部由可灵AI进行视频生成,电影导演完全依托视频生成大模型,群体深度参与电影级内容创作,这在中国尚属首次。
全球最大商业图库Getty Images推出免费高画质照片AI训练集:3750张照片、15项类别
9 月 9 日消息,以提供新闻、体育和娱乐照片授权闻名的全球最大的商业图库 Getty Images 上周宣布推出高画质照片样本训练数据集,供开发者开发和训练 AI 模型使用。该样本数据集包含 3,750 张照片,分为商业、教育、医疗健康、运动与健身、物品与物体、插图、图标等 15 个类别。数据集提供多种主题的高质量视觉内容,可用于训练机器学习和 AI 模型,开发多种应用场景。
国内RISC-V AI芯片设计公司知合计算完成A1轮融资,源码资本领投
月9日上午,国内基于RISC-V架构的 AI 芯片设计公司知合计算技术(深圳)有限公司(以下简称“知合计算”)宣布已完成数亿元人民币规模的A1轮融资。本轮融资由源码资本领投,领航新界、云九资本、乐朴投资、厚雪资本、临港新片区科创基金(由临港科创投担任管理人)等投资方跟投。
荣耀赵明谈苹果AI:让行业变得清醒,快餐式创新适得其反
荣耀CEO赵明表示,苹果对AI给出的方向将有助于整个行业更加清醒,构筑真正的AI需要脚踏实地努力。他强调,手机厂商不能仅仅依赖集成第三方AI服务来标榜自己的产品为AI手机。真正的AI手机,应具备如AI Agent这样的意图识别人机交互能力,这才是端侧AI的核心价值所在。
加入 AI 混战,蚂蚁全面加速「卷应用」
今年外滩大会期间,蚂蚁带来的一系列能搞定生活大小事的「AI 管家」,是这场变化的重要参与者。在用户端,AI 生活管家「 支小宝 」、AI 金融管家「 蚂小财 」、AI 健康管家亮相,这三个「AI 管家」,分别能帮你管事、管钱、管健康;在产业端,支付宝「 百宝箱 」,作为智能体开发平台让千行百业来「捏」生活中所需要的更多 AI 助理;在更纵深的研、产、供、销、服场景,蚂蚁专门成立了数字蚂力公司,打造 AI 人机融合解决方案。
特斯拉将获得 xAI 模型的授权,为特斯拉开发车载语音助理
据华尔街日报报道,马斯克旗下 xAI 公司讨论了分享未来特斯拉收入的协议。根据拟议的协议,特斯拉将获得 xAI 模型授权。据知情人士透露,xAI 将协助为特斯拉开发其他功能,包括在其电动汽车内安装类似 Siri 的语音助理,以及为人形机器人 Optimus 提供动力的软件。
2024年9月7日·周六
智谱AI正式宣布:智谱清言的“视频通话”功能全面免费开放。
智谱AI今日正式宣布:旗下全能AI助手 智谱清言 的“视频通话”功能现已全面开放,并对所有用户限时免费。新功能标志着“清言”不再局限于文字和语音交互,而是能够通过视频“看”世界,理解用户的表情和情绪,提供更自然、更人性化的交互体验。用户可以通过智谱清言APP尝鲜体验“视频通话”新功能。
开源大模型的新王—— Reflection 70B 诞生了,性能超越GPT-4o
快速更迭的开源大模型领域,又出现了新王: Reflection 70B 。横扫 MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了 GPT-4o,还击败了 405B 的 Llama 3.1。这个新模型 Reflection 70B,来自 AI 写作初创公司 HyperWrite。HyperWrite 公司的 CEO Matt Shumer 表示,Reflection-70B 现在是「世界上最顶级的开源 AI 模型」。
“算力版滴滴”发布 AI 云新品,PPIO CEO预测三年模型推理成本将下降1000倍
PPIO CEO姚欣坦言,算力需求和使用不平衡是一个长期存在的问题。从未来算力构成来看,95%是推理算力,5%是训练算力,但这95%也不会出现一家独大局面。姚欣预测,未来三年,AI 大模型推理成本或将下降1000倍以上。PPIO派欧云是“算力版的滴滴”,主要整合企业侧闲置碎片化的算力,承载多种服务,包括音视频和AI推理等。
2024年9月5日·周四
腾讯发布新一代大模型“混元 Turbo”:推理效率提升 100%,成本降低 50%
9 月 5 日消息,在今日的 2024 腾讯全球数字生态大会上,腾讯正式发布新一代大模型 —— 腾讯混元 Turbo。据腾讯官方介绍,该模型采用 MoE 架构,比上一代产品推理效率提升 100%,推理成本降低 50%。对外,腾讯混元 Turbo 的价格也比混元 Pro 降低 50%,输出价格为 0.05 元 / 千 tokens,输入价格为 0.015 元 / 千 tokens。
“ChatGPT之父”新公司成立仅3个月融资10亿美金,估值已超350亿
OpenAI联合创始人、前首席科学家、“ChatGPT之父”伊利亚·苏茨克韦尔(Ilya Sutskever)联合成立的新公司Safe Superintelligence (SSI) 宣布,近期已完成10亿美元融资。据悉,SSI此轮投资方包括a16z(Andreessen Horowitz)、红杉资本、DST Global 和 SV Angel,而由 Nat Friedman 和 SSI 首席执行官 Daniel Gross 运营的投资合伙企业 NFDG 也参与其中。
智源研究院推出全球首个包含文生视频的模型对战评测服务
智源研究院推出了全球首个包含文生视频的模型对战评测服务—— FlagEval 大模型角斗场。该服务支持国内外约40款大模型,覆盖语言问答、多模态图文理解、文生图、文生视频等任务,并提供在线或离线盲测。FlagEval大模型角斗场引入了主观倾向阶梯评分体系,包含五个梯度,以更细致地评测模型性能。
2024年9月4日·周三
OpenAI被曝将筹资数百亿美元打造AI基础设施
有媒体援引知情人士消息,OpenAI首席执行官Sam Altman计划吸引全球投资者支持建设人工智能AI基础设施的计划正变得更加明确,重点首先是在美国各州启动,预计将耗资数百亿美元。正在讨论的项目类型包括建设数据中心,通过涡轮机和发电机提高能源容量和传输,以及扩大半导体制造。
英特尔推出新一代AI PC芯片 官方宣称全面压过高通旗舰一头
近些日子深陷“缩缸”争议的英特尔,非常不巧地挑中了美股芯片板块大跳水之日,端出自家最新一代的酷睿Ultra笔记本电脑芯片。英特尔在周三凌晨发布的Ultra 200V系列芯片,一共有9款。不过与我们早些年熟悉的i5、i7产品区分方式不同,这一批芯片统一都是8核(4个性能核+4个效率核)。产品线的主要参数区别在于些许的CPU最高睿频、GPU核心数量和NPU引擎数量差异。
智谱和荣耀正式签署 AI 大模型技术联合实验室战略合作协议
据智谱官方消息,智谱和荣耀于 9 月 2 日,在北京正式签署 AI 大模型技术联合实验室战略合作协议。智谱表示,双方深化战略合作,将进一步探索基于用户场景的端侧 AI 智能体验,共同推动智能终端领域大模型技术和应用创新,并通过荣耀折叠屏手机等全场景产品为用户带来更加智慧便捷的 AI 服务。
OpenAI首款自研芯片来了,首发台积电A16工艺,与苹果正面较量
据中国台湾《经济日报》报道,苹果已经预定了台积电A16埃米(1.6nm)制程的首批产能,OpenAI也加入预定。另据科技媒体Wccftech报道,OpenAI开发基于A16埃米制程的定制芯片,是希望提升Sora的视频生成能力。据业界人士透露,OpenAI原先积极和台积电洽谈合作建设专用晶圆厂,但在评估效益后搁置了专用厂计划。
2024年9月3日·周二
8岁小孩哥上手用AI制作游戏,全程2小时,引来50多万人围观
一个八岁的孩子,在没有任何编程经验的情况下,居然手动建起了一个网站。是不是炒作不知道,但真的感知到了 AI 正在让编程变的越来越简单。在没有任何编码经验的情况下建立了一个 Three.js 网站,利用 Claude AI 工具,并让 Cursor 为他完成所有代码工作。
烧钱换增长,AI产品的流量玩法还走得下去吗?
2024年,国内AI产业的竞争逻辑,被一家大模型企业改变了。 Kimi 的爆火,为全行业的爆款焦虑找到了答案——通过投流推动用户增长。当所有人都参与到这场营销游戏,给国内大模型市场带来了短暂的“繁荣”。从3月开始,国内头部AI产品的流量均出现大幅增长。3月,国内AI应用访问量前10名的产品里,有9家访问量增速超过40%。
AI视频工具OpusClip获北美风投3000万美元投资,用AI革新视频编辑
OpusClip,一家由人工智能驱动的视频再利用初创公司,在由Millennium New Horizons主导的 A 轮融资中筹集了 3000 万美元,参与者包括Samsung Next、GTMfund 和 DCM Ventures,并正在通过新的 ClipAnything 功能增强其平台。这家初创公司致力于将长视频转变为可分享的、在社交媒体平台上病毒式传播的短片。
MiniMax大模型日均与用户交互30亿次,将发布多模态模型abab7
MiniMax自2021年底成立以来,已经构建了万亿参数的MoE文本大模型、语音大模型及图像大模型,推出了 星野 、 海螺AI 等原生应用,同时为企业和开发者提供开放平台API服务。MiniMax的大模型与终端用户进行了日均30亿次的交互,处理超过3万亿文本token,生成2000万张图像和7万小时的语音。
OpenAI ChatGPT 被曝将新增 8 种新语音:更自然表达狗叫等动物声音
科技媒体 testingcatalog 报道称通过逆向工程 ChatGPT 应用,发现 OpenAI 即将扩充添加语音,让朗读的声音更加自然和富有表现力。有迹象表明 OpenAI 未来可能会额外推出 8 种新的语音,每种语音都有一个独特的代号,后续可能会逐步推出。这些新声音的另一个有趣特点是,它们能够更自然地表达声音,如动物叫声或其他非语言声音。
Runway发布Gen-3 Alpha Extensions功能,视频可延长至40秒
据 Runway 官方消息, Runway 宣布发布Gen-3Alpha Extensions功能,可将视频时长延长至40秒。该功能支持用户仅凭简单的图片或文字输入,即可制作完整的故事情节或广告内容。时长的突破对广告制作、短视频创作等领域将产生深远影响,大幅提升创作效率。
2024年9月2日·周一
「无问芯穹」完成近5亿元A轮融资,成立仅16个月已吸纳近10亿
「无问芯穹」宣布完成近5亿元A轮融资。这也是目前为止,国内AI Infra(大模型基础设施)层创业公司最大的单笔融资记录。「无问芯穹」联合创始人、CEO夏立雪表示,本轮投资将用于加强技术人才吸纳与技术研发,深入推动产品商业化发展并强化生态合作。值得注意的是,成立仅仅16个月,「无问芯穹」的累计融资额已近10亿元。这家公司过往投资方还包括红杉中国、百度、智谱、同歌创投等。
MiniMax宣布推出视频生成模型和音乐模型,海螺AI已开放体验
8月31日,一向低调的“AI六小龙” 之一——MiniMax第一次正式对外,在上海办了场“MiniMax Link伙伴日”活动。在会上,MiniMax创始人闫俊杰宣布推出视频生成模型和音乐模型。此外,他预告,新⼀版能从速度和效果都对标GPT-4o的大模型abab7,会在未来⼏周内发布。目前所有用户都可以登录 海螺AI 官网体验视频生成和音乐生成功能。
讯飞星火版「Her」横空出世全民开放!百变人设逼真丝滑
OpenAI的「Her」还是期货, 讯飞星火 版「Her」就抢先上线了!不仅极速响应自由打断,还情绪价值拉满,各种情感、风格、方言随意切换。熊二被召唤出来的时候,家里的熊孩子直接被硬控了30秒。现在只要下载 讯飞星火APP ,即可体验对标GPT-4o的超自然AI语音助手。
千亿市值上半年营收仅6476万,寒武纪六个月亏了5个亿
AI芯片领域“冰火两重天”,最主要的AI芯片厂商英伟达近日公布2025财年第二季度财报,显示该季度营收同比增长112%,寒武纪则于8月30日晚间发布半年报,显示今年上半年营收有所下滑。据财报,寒武纪今年上半年营收6476.53万元,同比下降43.42%,净利润亏损5.3亿元,去年同期亏损5.44亿元。
360AI助手推出的「模型竞技场」功能,多种大模型之间对比测评
据 360 官方消息, 360AI助手 推出模型竞技场功能。360AI助手大模型竞技场支持显示大模型各大模型性能的详细数据:“模型响应速度”、“模型生成内容字数”、“模型完成生成内容任务耗时”、“模型生成内容效率”(每秒钟生成多少字),通过对比这些性能指标,用户可以看到不同大模型之间的性能差异,作为选择大模型的参考。
2024年9月1日·周日
专访宇树科技王兴兴:在人形机器人的巨变前夜,做一个敏锐的谨慎派
在目前大热的人形机器人、具身智能赛道,宇树科技是最受关注的公司之一。这家公司最大的标签是硬件实力强——一方面是性能,去年其首款通用人形机器人 H1 能奔跑、原地空翻、踹不到,拥有全球几乎规格最高的动力性能;另一方面是成本控制,今年其第二款人形机器人 G1 价格仅 9.9 万元,而同行普遍在数十万、乃至百万元。
Runway 从 HuggingFace 上删库“跑路”了,Stable Diffusion v1.5 也消失了
Runway 突然从Hugging Face平台删除所有数据并退出,未通知任何人。此前,Runway因版权问题被迫删除开源的Stable Diffusion 1.5版本。CEO曾表示发布该版本无问题,但后来可能因版权争议和市场竞争压力退出。
通义网页版升级!推出通义效率版块,上线“PPT创作” 通义网页版
上线“PPT创作”功能,具备言之有物、设计精美、智能编排三大核心特点。PPT创作功能完全免费,基于通义大模型打造。在通义网页版,音视频转文字产品“通义听悟”升级为“实时记录”,长文档阅读助手“通义智文”升级为“阅读助手”,与“PPT创作”功能共同合并为通义效率,实现从信息搜集整理、内容理解再到内容创作的完整工作学习流。
OpenAI 称 ChatGPT AI 聊天机器人全球周活跃用户数量破 2 亿
报道称 OpenAI 的 AI 聊天机器人目前周活跃用户数量已经超过 2 亿,短短 1 年时间实现翻倍。OpenAI 还表示在全球财富 500 强企业中,92% 正在使用其产品;自 7 月份发布 GPT-4o mini 以来,其自动 API 的使用量已翻了一番。
书生・天际 3.0 实景三维大模型发布:城市级 100 平方公里全范围实时渲染,VR 设备可用
据“书生 Intern”官方公众号推文,书生・天际 3.0 实景三位大模型现已开源发布,渲染效率提速近 6 倍,同时将应用方式拓展至 VR 设备。此前在去年 7 月,上海人工智能实验室联合多家机构发布了书生・天际(LandMark)实景三维大模型,号称首次实现城市级 100 平方公里全范围实时渲染。
2024年8月29日·周四
AI 图像生成公司 Midjourney 宣布进军硬件领域,苹果前硬件经理加盟
知名 AI 图像生成公司 Midjourney 宣布将涉足硬件领域,该公司今日在社交媒体 X 上发布消息,邀请人才加入其新成立的硬件部门。目前 Midjourney 尚未透露将开发何种类型的硬件设备,只是表示有多个项目在进行中,并强调“肯定有更多形态的可能性”。
安卓 / macOS 版 ChatGPT AI 应用现支持“@”,可无缝切换不同 GPT 模型
科技媒体 testingcatalog 昨日(8 月 28 日)发布博文,报道称安卓版和 macOS 版 ChatGPT 现支持 Mentions 功能,用户在聊天对话中使用“@”字符来调用不同的定制 GPT 模型。在安卓版 ChatGPT 应用中,用户输入“@”符号之后,会弹出一个窗口,让用户选择不同的 GPT,在保持聊天上下文的时候方便用户无缝切换。
英伟达财务公布三个月净赚1100亿,但市值一夜跌了6.89%
财报显示,第二财季,英伟达营收和净利润均超预期,营业收入达300亿美元(约合人民币2137.08亿元),同比增长122%,环比增长15%;净利润166亿美元(约合人民币1182.52亿元),同比增长168%,环比增长12%。财报公布后,英伟达股价在盘后交易中先涨超2%,后跌至6.89%,市值一夜减少了600万美元(约合人民币4274.16万元),大约相当于跌出了1个中芯国际A股(688981.SH)市值。
消息称 OpenAI 正进行新一轮融资谈判,估值破千亿美元
综合 CNBC、《华尔街日报》等消息,OpenAI 正在进行一轮融资谈判,将使这家 AI 初创公司的估值超过 1000 亿美元(IT之家备注:当前约 7124.5 亿元人民币)。据不具名知情人士透露,Thrive Capital 正在主导本轮融资,并将投资 10 亿美元(当前约 71.24 亿元人民币)。今年早些时候,OpenAI 的估值就已超过 800 亿美元(当前约 5699.6 亿元人民币),高于上一年的 290 亿美元。
美图发布 2024 年中期业绩,经调整归母净利润 2.78 亿元,净利润大涨 80%
8 月 28 日,美图发布 2024 年中期业绩,2024 年 1 到 6 月美图收入 16.2 亿元人民币,同比增长 28.6%,而最亮眼的数据则是经调整归母净利润 2.78 亿元,同比增涨 80.3%。美图给出的两个业绩增长的原因,都是与主营业务相关。一是 AI 技术的加持下,2023 年 6 月,美图一口气推出/更新了 6 款产品,包含 美图设计室 V2、 开拍 、AI 数字人 DreamAvatar 等面向 B 端用户的生产力产品,驱动了国内用户付费的增长。另一个是全球化,美图的 App 在多家应用商店名列前茅,国外用户及付费用户也实现了双增长。
Kimi推出moonshot-v1-auto模型API,Kimi API将推出联网搜索功能
Kimi 开放平台推出了名为moonshot-v1-auto的新模型API,这一功能能够根据上下文所需的Tokens数量自动选择合适的模型,从而帮助用户节省费用。同时,官方预告了Kimi API新功能:将推出联网搜索功能。
开放平台 商汤科技半年报:生成式AI业务收入占比首超传统AI
根据最新发布的财报,商汤科技2024年上半年总营收达17.4亿元,同比增长21%。其生成式AI业务收入同比激增256%,达到近11亿元,首次超越传统AI业务,占总收入的60%。
2024年8月28日·周三
谷歌发布 3 款 Gemini 实验 AI 模型:1.5 Pro 冲榜第二、1.5 Flash 从第 23 蹿升至第 6
谷歌 AI Studio 产品总监洛根・基尔帕特里克(Logan Kilpatrick)今天(8 月 28 日)在 X 平台发布推文,宣布推出 3 款 Gemini 实验性模型。Kilpatrick 表示,新的 Gemini 1.5 Pro Exp 0827 型号在各方面都优于 8 月初发布的实验型号,目前在 LMSYS 上的排名为第 2 位,仅次于 OpenAI 的 GPT-4o-latest 模型。
Anthropic 向所有 Claude 用户开放 Artifacts AI 功能
AI 科技公司 Anthropic 今天(8 月 28 日)发布博文,宣布面向所有 Claude 用户开放 Artifacts 功能,用户现在可以在 iOS 和安卓版 Claude 应用中创建和浏览 Artifacts。Artifacts 相当于创建了一个动态工作区,用户和 Claude 对话让其生成文档、代码、矢量图,甚至是简单的游戏过程中,Artifacts 会出现聊天界面旁边,方便用户实时查看、迭代和创建你的作品。
OpenAI “草莓项目” 最快今年秋季发布,随后是 “猎户座”(Orion)
AI工程师Tom Keldenich表示,OpenAI正在开发“草莓”和“猎户座”(Orion)两种模型。草莓主要用于解决复杂推理任务,尤其是在数学和编程领域,也会极大增强大模型的语言理解能力,例如,在《纽约时报》的测试中就表现非常好。猎户座则是超越 GPT-4 的继任模型,但其预训练数据由草莓模型生成。也就是这两个模型加起来,将会比现在任何模型的推理、生成能力都强。
中国AI芯片龙头燧原科技启动IPO上市辅导,腾讯持股超20%
据中国证监会官网披露,上海燧原科技股份有限公司(以下简称“燧原科技”)首次公开发行股票并上市辅导备案报告,完成上市辅导备案登记,辅导机构为中金公司。这意味着,这家成立6年、累计融资额近70亿元人民币,估值已超160亿元(胡润数据)的燧原科技正式启动科创板IPO上市,有望成为继寒武纪之后,国内科创板上第二家 AI 算力设计公司。
字节成立大模型研究院,疯狂氪金 AI 人才
据 AI 科技评论报道,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。知情人士称,已有外部 AI 大牛加入大模型研究院,直接向张一鸣汇报。2023 年 8 月,字节自研的底层大模型“云雀”上线,随即推出 AI 对话产品“ 豆包 ”。今年 5 月,字节发布“豆包大模型”家族,发起价格战,号称“比行业便宜 99.3%”。
2024年8月27日·周二
Viggle 宣布获a16z的1900万美元投资,帮助 Viggle 扩大规模、加速产品开发
据TechCrunch报道, Viggle 宣布已完成由 Andreessen Horowitz 领投的 1900 万美元 A 轮融资,Two Small Fish 也参与其中。这家初创公司表示,此轮融资将帮助 Viggle 扩大规模、加速产品开发并扩大团队。Viggle 告诉 TechCrunch,它与 Google Cloud 等云提供商合作,以训练和运行其 AI 模型。
虹软科技披露半年报:营业收入3.81亿元,PSAI产品正拓展国际市场
报告期内, PSAI产品 陆续入驻阿里巴巴集团旗下的淘宝千牛商家工作台和1688平台、抖店微应用、抖店服务市场。今年上半年,虹软科技实现营业收入3.81亿元,同比增长11.97%;归母净利润6145.89万元,同比增长22.82%;扣非净利润5379.43万元,同比增长21.7%。
苹果官宣进军机器人行业,9月10号推出首款 AI iPhone
据彭博社消息,苹果被爆正探索机器人相关的新业务。从爆料信息来看,这款机器人并非当下热议的人形机器人,而是一款桌面机器人,代号为J595。今天凌晨,苹果宣布将于北京时间9月10日凌晨1点,在加利福尼亚州库比蒂诺总部举办主题为“高光时刻(It ‘s Glowtime)”的特别活动。在苹果今年最重要的一次发布会上,苹果预计将推出最新款iPhone、Watch和AirPods。
小鹏自研芯片流片,算力是同行三倍,为AI定制设计
小鹏汽车自研的智能驾驶芯片已经成功流片。有知情人士透露,小鹏智驾芯片专门针对AI需求、端到端大模型等设计,是支持舱驾一体的中央计算架构芯片,“AI算力接近3颗主流智驾芯片的水平”。8月27日,小鹏10周年及M03上市活动中,小鹏汽车将正式发布自研芯片信息。
xAI Grok-2挤进聊天机器人排行榜第二名,紧追GPT-4o 据大模型排行榜
lmsys 官方消息,xAI 的聊天机器人 Grok-2 现已挤进聊天机器人排行榜第二名,仅次于 ChatGPT 4o。据悉,根据6000份社区投票,Grok-2 夺得了第二名,超越了 GPT-4o(5 月),与最新的 Gemini 并列!Grok-2-mini 也以令人印象深刻的成绩排名第五。
2024年8月26日·周一
亚马逊 CEO 安迪・贾西:AI 助手 Amazon Q 可节省约 4500 个开发人员一年工作量
亚马逊 CEO 安迪・贾西在其领英主页发帖称,将亚马逊的 生成式 AI 开发助手 “Amazon Q” 集成到内部系统后,利用新的代码转换功能,Amazon Q 将应用程序升级到 Java 17 的平均时间从开发人员的 50 天左右缩短到了几个小时,估计节省了约 4500 个开发人员一年的工作量。
Meta 发布 Imagine Yourself:无需为特定对象微调的个性化图像生成 AI 模型
从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“ Imagine Yourself ” AI 模型。
一句话生成《黑神话:悟空》3D资产,胡渊鸣创业项目Meshy上新,免费试用
截至目前,Meshy 已经更新到了第 4 代。从 2023 年 11 月登场, Meshy 就以快速、保真、操作简易走在行业前列。在 Meshy-4 中,胡渊鸣团队突破了 3D AI 生成的一些技术难题,无论你是使用文本到 3D 还是图像到 3D,现在都能体验到生成模型的几何质量大幅提升。
2024年8月23日·周五
快手可灵 AI 推出会员订阅计划:支持 AI 图片 / 视频,首月 19 元起
快手可灵 AI 推出会员订阅计划,其中连续包月首月最低价 19 元、次月 58 元,可生成约 66 个视频或 3300 张图片,还可享受高表现视频生成、视频延长、大师运镜等多项会员专属功能。快手刚发布的 2024 年二季度财报显示,可灵 AI 已有超百万用户,累计生成了超千万视频。
AI辅助搜索越来越受欢迎 Perplexity计划在四季度开始投放广告
人工智能(AI)搜索初创公司Perplexity AI周四宣布,该公司计划于第四季度在其搜索应用程序上投放广告。据知情人士声称,在广告方面, Perplexity 将采用一种名为CPM(每千次展示成本)的模式,价格将超过50美元。它指的是广告主付给媒体的每千次广告展示费用,而不是每次点击费用。
微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频
微软 Azure AI 语音服务允许开发者构建多语言生成式 AI 语音应用,Azure AI 语音服务最新推出了文本到语音虚拟人功能,可以将简单的文本转换为人类自然说话视频。今天,微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。
李彦宏:文心大模型日调用量超6亿,日均Tokens使用量约1万亿
在百度2024年第二季度财报电话会上,百度创始人、董事长兼首席执行官李彦宏披露, 文心大模型 日均调用量超6亿次,日均处理Tokens文本约1万亿,均为国内最高。对比23年Q4公布的5000万次日均调用量,半年增长超10倍。季度内,百度推出性能更优的文心大模型4.0 Turbo,并发布多项优惠策略。
抖音搜索推出独立APP:内容主要为短视频、图文等
据 Tech 星球报道,抖音近期推出抖音搜索的独立 APP。据悉,“抖音搜索”的展示内容则主要是由博主创作的短视频、图文等内容为主。用户通过在搜索栏内搜索相关的关键词或句子,即可在综合频道下找到对应的短视频和图文内容。此外,还细分有视频、图文经验、商品等搜索频道,可进一步精准搜索结果。
腾讯会议上线17种语言实时翻译,基于腾讯混元、腾讯翻译
腾讯会议升级多语言翻译能力,支持将声源语言翻译为中文、英语、日语、韩语、俄语、泰语、印尼语、越南语、马来语、菲律宾语、葡萄牙语、土耳其语、阿拉伯语、西班牙语、印地语、法语、德语等17种语言。功能升级后,腾讯会议企业版、商业版用户在会议中的字幕、实时转写以及会议后的录制页中均能使用。据介绍,该功能由 腾讯混元大模型 、腾讯翻译提供支持。
2024年8月22日·周四
a16z发布全球 Top 100 AI 应用榜单,字节跳动大放异彩
a16z发布了全球Top 100 AI应用榜单,字节跳动的多款应用新上榜,包括教育科技平台Gauth、机器人构建器Coze和通用助手豆包。图像和视频内容编辑在移动端应用广泛,美学和约会应用崛起。Anthropic的Claude在网络端排名上升,AI助手Luzia在移动端表现突出。
字节豆包语音模型和视觉模型再升级 综合能力提升20.3%
2024火山引擎 AI 创新巡展在上海举办,带来豆包大模型的一系列产品升级。豆包语音模型和视觉模型再升级,对话式 AI 实时交互解决方案进一步强化 AI 交互体验。最新版 豆包 大语言模型的综合能力相比三个月前首次发布时提升了20.3%,豆包·文生图模型、豆包·语音识别模型等模型也有大幅升级
百度、商汤、智谱前三,IDC 首次发布大模型平台及应用市场份额报告
国际数据公司(IDC)于今日首次发布了《中国大模型平台市场份额,2023:大模型元年 —— 初局》。数据显示,2023 年中国大模型平台及相关应用市场规模达 17.65 亿元人民币。受益于多年来在 AI 领域的大力投入以及大模型的早期投入,百度智能云在 2023 年大模型市场规模达 3.5 亿元人民币,位居市场第一,市场份额达 19.9%;商汤科技位居市场第二,市场份额达 16.0%; 智谱 AI 则是 2023 年初创企业中的胜出者,位居市场第三。
泡茶、弹琴、练咏春,星尘智能发布 AI 机器人助理
Astribot S1 Astribot 星尘智能发布了 AI 机器人助理 Astribot S1,支持泡茶、做饭、弹琴、练咏春拳等,还能 VR 遥控。据星尘智能介绍,Astribot S1 采用了刚柔耦合传动机构,自主研发关键零部件,搭载软硬件一体化系统架构。
2024年8月21日·周三
谷歌开放 HeAR AI 模型 API:1 亿条咳嗽声训练,辅助筛查、诊断和监测肺结核
谷歌公司于 8 月 19 日发布博文,宣布通过 Google Cloud API,目前已经向研究人员开放健康声学表征(Health Acoustic Representations,简称 HeAR)AI 模型。谷歌 HeAR AI 模型可以帮助人类诊断疾病,可以通过分析人的咳嗽和呼吸,诊断出疾病。
OpenAI 开放 GPT-4o 微调功能,企业可更轻松打造专属 AI 助手
OpenAI 推出了一项新功能,允许企业客户使用自己的数据来定制其最强大的 AI 模型 GPT-4o。此举旨在应对日益激烈的 AI 企业应用竞争,并满足企业对 AI 投资回报的更高要求。通过微调,现有 AI 模型可以针对特定任务或领域进行优化。
PICO发布“中国版Vision Pro”,搭载的AI芯片性能暴增800%
8月20日下午,字节跳动旗下XR平台PICO推出首款MR混合现实一体机PICO 4 Ultra,硬件上搭载全新高通骁龙XR2 Gen2计算平台,拥有12GB超大内存,GPU性能相比前代XR1提升2.5倍,AI性能比XR1提升8倍。价格方面,PICO 4 Ultra消费者版本售价4299 元,PICO 4 Ultra Enterprise(企业版)7499 元,PICO体感追踪器售价399元一对,现已全面开启预售
iPad 上最强的绘画应用 Procreate ,永远不会在其产品中引入生成式 AI
Procreate CEO James Cuda 宣布该应用将永不使用生成式AI技术,以保护艺术家免受其影响;Procreate 是一款受欢迎的iPad绘图应用,自2011年上线以来获得多个奖项,并广泛用于艺术和设计教育;尽管Procreate拒绝采用生成式AI,公司仍将继续使用传统的机器学习技术来优化应用功能。
EliseAI 跻身纽约独角兽行列:D轮融资7500万美元、估值超10亿美元
据VentureBeat官网报道,近日,房产科技公司 EliseAI 宣布成功完成7500万美元D轮融资,此轮融资由知名风投公司 Sapphire Ventures 领投,新筹集的资金将主要用于扩充团队规模,推进产品研发。至此,EliseAI的估值超过10亿美元,成为了纽约最新的独角兽公司。
2024年8月20日·周二
Luma Dream Machine v1.5版本发布,更快、更真、更清晰
据 Luma AI 官方消息,Luma Dream Machine v1.5版本已经在近日发布,在视频生成方面获得巨大改善。据Luma官方表示,Luma Dream Machine v1.5版本在视频生成方面取得了显著进步,不仅提升了视频的质量,更缩短了生成时间。现在,用户可以在更短的时间内,得到更高质量的视频作品。
AMD 宣布 49 亿美元收购服务器制造商 ZT Systems 以挑战英伟达
AMD 宣布同意以 75% 现金和 25% 股票交易方式收购服务器制造商 ZT Systems,交易价值为 49 亿美元,以增加数据中心技术。ZT Systems 将成为 AMD 数据中心解决方案业务集团的一部分。ZT Systems 在过去 12 个月的收入超过 100 亿美元。
通义千问宣布启用新域名“tongyi.ai”,网页版聊天新增深度搜索功能
阿里大语言模型“ 通义千问 ”今日宣布启用新域名“tongyi.ai”,并带来多项新功能。网页版聊天新增深度搜索功能;App 图片微动效支持多尺寸图片;App 自定义唱演支持 3:4 画幅(原先 1:1)。
科大讯飞推出“星火极速超拟人交互”:可模仿孙悟空、蜡笔小新等音色、语气、人设
科大讯飞今日宣布对星火语音大模型进行更新,带来“星火极速超拟人交互”,计划于 8 月 30 日上线 讯飞星火 App。“星火极速超拟人交互”采用统一神经网络实现语音到语音的端到端建模。官方称即便被频繁打断,也能“迅速反应”,更加符合日常对话情境。
OpenAI 关闭 SearchGPT 候补名单,针对 10000 名用户开始测试
据 The Verge 报道,OpenAI 宣布其新产品 SearchGPT 的候选名单已经关闭,并开始用户测试。在初始阶段,只有 10000 名用户将被授予访问权限,这可能有助于避免搜索机器人提供错误建议的情况。SearchGPT 可以让用户用自然语言提问,并获得详细、易懂的答案,就像在与专家交谈一样。系统能够保持对话的上下文,理解复杂的查询,甚至自己澄清细节。
2024年8月19日·周一
斯坦福都在用的 AI 学术搜索引擎 Consensus 获 USV 1100 万美元领投
近日,AI 学术搜索引擎 Consensus 宣布完成 1100 万美元融资,A 轮融资由 Union Square Ventures 领投,其他投资者还包括 Nat Friedman、Daniel Gross 以及 Draper Associates 等。据悉,Consensus 目前拥有 40 万月活跃用户,包括学生、医生和注重健康的消费者,这些用户通过搜索引擎来回答各种问题,包括肌酸补充剂、正念的好处以及现金转移是否可以减少贫困。
谷歌前CEO施密特最新演讲全文实录:坦言“卷”才是企业唯一的出路
Google 前 CEO ,「现在已经不是 Google 员工」的施密特(Eric Schmidt)前不久在斯坦福做了一次分享。分享被拍成视频上传到斯坦福在线课 YouTube 官号,其中有 40 多分钟施密特与学生 Q&A 的环节。因为观点太直接,说话太实在,施密特的分享上了新闻。
稚晖君一口气发布5款人形机器人,远征A2系列主打“面向量产改进”
在这场发布会中,稚晖君一口气推出了三款远征系列机器人产品:交互服务机器人「远征 A2」、柔性智造机器人「远征 A2-W」、重载特种机器人「远征 A2-Max」。最后的 One more thing 环节,智元 X-Lab 孵化的模块化机器人系列产品「灵犀 X1」和「灵犀 X1-W」也作为「彩蛋」正式亮相。
中国首个接入大模型的Linux开源操作系统正式发布——Linux发行版
deepin V23 知名开源社区——deepin(深度)社区正式对外发布了开源操作系统——Linux发行版 deepin V23。作为中国首个开源操作系统根社区推出的发行版本,deepin V23真正实现了操作系统在仓库、应用层、操作系统核心组件上都有自研模块,向全球开源爱好者输出提供优异的源自中国的开发套件!
2024年8月12日·周一
讯飞智文 2.0 版本发布:内置 AI PPT 编排创作引擎,基于星火大模型
从讯飞开放平台获悉, 讯飞智文 2.0 版本今天正式发布,带来 PPT 文本生成大模型、AI PPT 编排创作引擎、AI PPT 在线编辑模组三大技术升级。据介绍,讯飞智文 2.0 依托讯飞星火 V4.0 的底座能力,在文本生成方面进行了独立训练,对用户输入的主题具备更强大的理解能力。用户在“主题创建”中输入一句话主题,再勾选“联网搜索”,大模型即可自动抓取实时资讯,以确保事实的时效性、准确性。
毒舌 AI Twitter Personality 每小时赚 4000 美元,每分钟 36 个新用户
病毒式传播的“毒舌 AI”Twitter Personality 每小时赚4000美元!(约2.8万元),只需输入一个推特用户名,就能得到 AI 根据历史发言做的犀利点评。而且只要是公开账号就行,并不需要获取任何权限,除了查看 AI 对自己的看法,还可以用来恶搞朋友,甚至名人。“毒舌AI”Twitter Personality构建在低代码开发平台 Wordware 上。
马斯克宣布Grok 2测试版即将发布,年底发布Grok 3
特斯拉 CEO 马斯克当地时间 8 月 11 日晚在 X 平台上表示,人工智能模型 Grok 2 测试版即将发布。Grok 2 发布后将紧随 Grok 3,马斯克此前称其将在年底左右推出。他表示,xAI 一直在训练 Grok 3,该模型的水平将“达到或超越”尚未发布的 OpenAI GPT-5
2024年8月10日·周六
秘塔科技完成超1亿元融资,蚂蚁集团领投
据晚点latepost 报道,秘塔科技近期完成了超 1 亿元人民币的新一轮融资,由蚂蚁集团领投、光速光合跟投。本轮投后估值达 1.5 亿美元。据了解,百度、腾讯等大型科技公司也曾在这轮融资期间与秘塔接触,最终蚂蚁与秘塔达成交易。去年以来,蚂蚁集团在 AI 领域已至少投资 6 家公司,包括大模型公司智谱 AI、月之暗面,视频生成公司爱诗科技、生数科技 ,AI 芯片公司墨芯和最新的秘塔。
字节豆包大模型已支持实时语音通话
字节跳动旗下火山引擎今日宣布推出对话式 AI 实时交互解决方案,搭载火山方舟大模型服务平台。该方案通过火山引擎 RTC 实现语音数据的采集、处理和传输,并深度整合 豆包 ・语音识别模型和豆包・语音合成模型,简化语音到文本和文本到语音的转换过程,提供智能对话和自然语言处理能力,帮助应用实现用户和云端大模型的实时语音通话。
2024年8月9日·周五
小米旗舰设备国际版将接入谷歌 Gemini 大模型,OPPO 此前已接入
小米创办人雷军 8 月 7 日宣布,小米旗舰设备国际版将接入谷歌 AI 大模型 Google Gemini。小米目前已在国行机型中推出了自家的 AI 功能,7 月 30 日,小米小爱同学「大模型小爱」宣布全量升级,支持自然问答、图片编辑、车外唤醒防御等,覆盖核心品类设备。
毒舌 AI 上线 𝕏:马斯克、霉霉甚至全球 400 万网友被 Wordware 骂破防
这个名叫 Wordware 的产品,是一个 IDE 平台,可以在上面用自然语言构建 AI Agent。而大火的这个推特罗伯特,是个调用 Claude 的 AI Agent,号称「发现你的推特人格」。只要把你的推特账号输入进去,它就会阅读你的推文,然后用 LLM 来分析你的个性。
阿里开源Qwen2-Math:数学推理全球第一,超越GPT-4o和Claude-3.5
阿里开源了 Qwen2-Math (1.5B/7B/72B)系列,Qwen2-Math是一系列基于Qwen2 LLM构建的专门用于数学解题的语言模型,数学推理能力全球第一。在Math上的评测结果表明,最大的数学专用模型Qwen2-Math-72B-Instruct超越了最先进的模型,包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro和Llama-3.1-405B。
OpenAI 宣布 DALL-E 3 模型向 ChatGPT 免费用户开放
北京时间今天凌晨,OpenAI 宣布 ChatGPT 免费用户可以每天使用其 DALL-E 3 模型生成图片。DALL-E 3 于去年 9 月推出,起初只面向 ChatGPT Plus 付费订阅用户提供。
Mistral AI推出新开发工具La Plateforme 用户可自主优化和构建智能Agents
Mistral AI 近日宣布,推出全新 AI 工具La Plateforme以及 Agents平台,为用户和开发者提供更强大、更灵活的AI模型优化和应用能力。Mistral表示,他们的模型终于可以通过La Plateforme进行微调,让用户可以更好地利用自己的数据进行优化。同时,Agents平台则可以帮助用户对模型进行详细调整,构建出更加智能的Agents。
阿里巴巴推出科研自动化AI助手DS Assistant
据阿里巴巴官方消息,阿里巴巴近日推出了一款名为DS Assistant的AI数据科学助手,它能够自动化地完成从数据探索到模型评估的全流程,让数据科学工作变得更加简单、高效。DS Assistant基于Modelscope-Agent框架开发,这一框架由阿里巴巴开源,具有丰富的工具生态和灵活的模块设计。
字节跳动旗下豆包上线音乐生成功能,用户可一键“撰写”词曲
字节跳动旗下智能 AI 助手 豆包 今日上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词,设定音乐风格、情绪及音色,便能快速生成一首约 1 分钟的词曲。目前,豆包音乐生成功能提供民谣、嘻哈、R&B 等 11 种音乐风格,其中还涵盖了爵士、雷鬼、电音等相对小众的曲风,用户可选择男声或女声演唱。
阿里云推出首个域名 AI 大模型应用,上线“.ai”域名后缀
阿里云在万网焕新发布会上宣布,域名产品服务完成 AI 化系列改造,推出首个域名 AI 大模型应用,并上线“.ai”等 40 余个全新的域名后缀、2000 万个全球域名资源。据阿里云官方介绍,升级后的阿里云万网,实现了智能起名。用户输入只需输入品牌信息与所属行业,一键点击后,基于通义大模型就能批量生成创意域名。
2024年8月8日·周四
OpenAI基金牵头6000万美元投资硬件初创企业Opal
据The information报道,OpenAI基金正在牵头为Opal(之前称为Opal Camera)进行 6000 万美元的 B 轮融资。其他投资方包括 YouTuber Casey Neistat和TikTok兄弟Charli和Dixie D’Amelio,以及Founders Fund和Kindred Ventures在内的现有投资者参投。
月之暗面 Kimi 上下文缓存 Cache 存储费用降价 50%
月之暗面宣布, Kimi 开放平台的上下文缓存 Cache 存储费用降价 50%,Cache 存储费用由 10 元 / 1M tokens / min 降低至 5 元 / 1M tokens / min,即日起生效。7 月 1 日,Kimi 开放平台上下文缓存(Context Caching)功能开启公测。官方表示,该技术在 API 价格不变的前提下,可为开发者降低最高 90% 的长文本旗舰大模型使用成本,并提升模型响应速度。
GPT-4o新版本上线:丝滑解决9.11和9.9谁大,更强也更便宜了
GPT-4o新版本上线,更强更便宜。能力全方位提升,ZeroEval基准测试直接跃居第一。输入和输出分别节省50%、33%。token输出扩展到16k,此前支持4k。9.11和9.9谁大这个问题,也能丝滑解决。这是因为OpenAI给API中引入了结构化输出,通过JSON 模式确保模型输出符合开发者定义的结构,能让模型变得更可靠安全。最新版模型“GPT-4o-2024-08-06”在JSON模式评估中,得分100%。
2024年8月7日·周三
Canva 可画发布一站式 AI 创作套件“魔力工作室”:支持生成花字、转场动画
在 8 月 6 日的“Canva Connect 连接你我,可画未来”主题活动中,在线视觉传播和协作平台 Canva 可画宣布,一站式 AI 创作套件“魔力工作室”在中国正式上线。该套件号称“人人可用的一站式 AI 创作套件”,功能包括基于 AIGC 的文案生成、图片生成、花字特效生成、图片编辑、转场动画设计生成等。
腾讯元宝上线深度阅读模式:支持最长近50万字输入,可提炼论文、生成杜邦分析图
腾讯元宝 宣布,在最新版本的腾讯元宝中,当用户上传论文、财报、研报等专业内容的 URL 链接或文件,除获得文字概括总结外,还可进入深度阅读模式,对长文进行精读。深度阅读模式可原生支持最长近 50 万字的输入,能够在理解专业内容的基础上,生成图文并茂的内容,不仅可以引用输入内容的原图,还能通过代码绘制高阶的分析图。
「零一万物」完成数亿美元融资,某国际战投、东南亚财团加盟
李开复创办的AI大模型独角兽公司零一万物已经完成新一轮融资,金额达数亿美元。知情人士表示,此轮融资参与方包括某国际战投、东南亚财团等多家机构。如今的“大模型六小虎”(智谱AI、零一万物、百川智能、MiniMax、月之暗面、阶跃星辰),正以惊人的速度,跨过200亿元的估值大关。
OpenAI API引入结构化输出功能,助力开发者智能连接外部工具
OpenAI 在 API 中推出了新的结构化输出功能,这为开发者提供了一种更可靠的方法,将 GPT 的能力与外部工具和 API 连接起来。这一功能允许开发者向 gpt-4-0613 和 gpt-3.5-turbo-0613 描述函数,并让模型智能地选择输出一个包含调用这些函数参数的 JSON 对象。
“地表最强”人形机器人Figure 02发布!OpenAI加持,已在宝马打工
美东时间8月6日,全球最备受瞩目的人形机器人公司「Figure AI」,炸场发布了第二代人形机器人Figure 02。在宝马工厂工作,不管是拿钢材,还是组装器械,它都不在话下!据介绍,此次它的手有着惊人的16个自由度,能承受与人类相当的重量。各种脏活累活,一整个拿捏,更何况CEO望子成龙,说希望它最长能工作20个小时。
国产端侧模型又出力作,面壁“小钢炮”MiniCPM-V 2.6模型重磅上新
面壁“小钢炮”MiniCPM-V 2.6模型重磅上新,以8B参数,取得20B以下参数的单图、多图、视频理解3 SOTA成绩,首次在端侧实现单图、多图、视频理解等多模态核心能力全面超越GPT-4V,单图理解越级比肩Gemini 1.5 Pro和GPT-4o mini。
零一万物宣布Yi API Function Call 功能上线
据零一万物官方消息,Yi API 正式新增 Function Call 功能。据零一万物表示,最新的模型 Yi-Large-FC 经过针对性训练,具备良好的深度理解能力、强大的指令遵循能力,既能根据用户的输入判断何时应调用函数,又能使用更贴近工具函数定义的 JSON 进行响应;同时完美兼容 OpenAI 的接口设计,能够丝滑“平替GPT”。
阿里国际推出首个专业版AI Search,全球贸易领域的「下一个 Google」
阿里国际宣布入局,带来了一款新产品。与其它所有人都不同,阿里国际的 AI 搜索切入了一个空白地带:涉及更多行业 Know-How 的深度信息搜索领域。阿里国际选择了自己最擅长的「全球电商」行业,意在改变全球采购流程,使之更加直观和高效。
2024年8月6日·周二
通义App推出角色扮演功能,可一键替换视频人物
8月6日, 通义App 推出角色扮演功能,可一键替换视频人物。上传一段视频,选择要替换的3D角色,可以在不改变其他场景和人物的情况下,将视频里原有的角色一键变身为有趣的3D角色模型,实现让孙悟空跳水、机器人打网球、二次元女孩揉面等创意视频。
谷歌将为 Chromebook 推出 AI 助手 Bluebuddy
据 WindowsReport 报道,谷歌正在为Chromebook 系列笔记本电脑打造一款名为 Bluebuddy 的 AI 助手,将帮助用户解决蓝牙相关问题。这款新助手将在 ChromeOS 中推出,用户只需输入遇到的问题,系统就会推荐相应的解决方案。
OpenAI 宣布今年DevDay 定档十月,不会发布GPT-5,聚焦 API 和开发工具
据 TechCrunch 报道,OpenAI 表示将改变 DevDay 大会的形式,从一个大型活动转变为一系列开发者参与会议。OpenAI还确认,它不会在 DevDay 期间发布下一款主要旗舰大模型,而是将重点放在 API 和开发者服务的更新上。
月之暗面完成3亿美元新一轮融资,投后估值33亿美元
据彭博社报道,月之暗面( Kimi 母公司)刚刚完成了新一轮 3 亿多美元融资,此次融资将月之暗面的估值推高至 33 亿美元,并吸引了包括腾讯、高榕资本和老股东阿里巴巴在内的其他投资者。
Adobe 推出 免费 AI 工具,面相 K12 教育市场
据 zdnet 报道,Adobe 公布了 Adobe Express for Education 的新功能,该平台旨在成为一个负责任的、课堂安全的人工智能工具,鼓励学生掌控自己的学习体验。这新的功能包括生成模版,他可以让学生为艺术项目或者是活动创建自己的模版。另外还有图像生成和生成填充功能,可以帮助学生将脑中的想法转化为图像。
2024年8月5日·周一
中兴星云研发大模型通过备案,号称代码生成能力达 GPT-4 水平
中兴通讯官微今日宣布,在近日发布的广东省生成式人工智能服务备案公告中,中兴星云研发大模型顺利完成各项评估,通过备案。据介绍,中兴星云研发大模型支持需求、设计、编程、测试等不同阶段的 30 多种场景和多种主流编程语言,为开发者提供一站式、智能化的研发体验。
Neuralink 已为第二位人类患者成功植入脑机接口
马斯克透露,旗下脑机接口公司 Neuralink 已将第二颗脑机接口芯片植入了第二位人类患者体内。在访谈中,马斯克表示,第二颗植入物的进展似乎非常顺利。7 月 11 日,马斯克曾Neuralink 团队在 X 平台上进行了直播。在这次直播中马斯克表示,Neuralink 计划在一周左右的时间内将其设备植入第二位人类患者体内。
Figure预告人形机器人二代新品,人味儿更浓、硬件更强
Figure公布了Figure 02预告片,并表示将在北京时间8月7日正式发布该产品。相对于Figure 01搭载Open AI GPT4的视频演示,此次展示介绍的重心在于硬件,预计硬件能力有大幅提升。该公司创始人CEO布雷特•阿德科克(Brett Adcock)自信发言: Figure 02是地球上最好的人形机器人。
OpenAI 承认正研发 ChatGPT 文本水印,但面临挑战
据《华尔街日报》报道,OpenAI 已经开发出一款能够高精度识别 ChatGPT 生成文本的工具,但迟迟未发布。对此 OpenAI 进行了回应,承认正在研究文本水印技术,但表示这项技术仍存在诸多挑战。
中文多模态理解榜单发布,腾讯混元国内第一
中文多模态大模型SuperCLUE-V基准8月榜单发布,测评涵盖了国内外最具代表性的12个多模态理解大模型,包含4个海外模型和8个国内代表性多模态模型,评估内容包含基础能力和应用能力,以开放式问题对多模态大模型进行评估。腾讯混元大模型在多模态基础能力和应用能力方面获得总分71.95的高分,斩获国内大模型排名第一,稳居卓越领导者象限。
英伟达新款AI芯片或因设计缺陷推迟发布
据《The Information》报道,帮助生产英伟达新 AI 芯片和服务器硬件的两位知情人士透露,由于存在“设计缺陷”,英伟达新型 AI 芯片的发布将被推迟三个月甚至更长时间。
2024年8月4日·周日
“AI教母”李飞飞:Sora仍是二维图像,只有三维空间智能才能实现AGI
美国国家工程院院士李飞飞认为,实现AGI的关键一环是“空间智能“,而非二维智能。只有通过空间智能,才能看到世界、感知世界、理解世界并让机器人做事,从而形成良性闭环。
Google官宣“收购”Character AI并收编团队
据媒体报道,Character的管理层周五告诉员工,Character投资人的股票将以每股约88美元的估值被收购。这大约是 Character 2023 年 A 轮融资股票价值的 2.5 倍,当时该公司的估值为 10 亿美元。
微软 GitHub 推出 Models 服务:定位 AI 工程师,让开发者试用和部署模型
微软旗下代码托管平台 GitHub 最新推出了 GitHub Models 服务,定位是新一代 AI 工程师,帮助开发者选择适合其应用的 AI 模型。GitHub Models 服务目前处于限量公测阶段,可以对接 OpenAI 的 GPT-4o 和 GPT-4o mini、微软的 Phi 3、Meta 的 Llama 3.1 以及 Mistral 的 Large 2 等 AI 模型,并承诺未来会继续扩充更多语言和视觉模型。
谷歌推出Gemini 1.5 Pro(0801实验版),首次夺得lmsys竞技场第一
历时一周,超1,2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一(中文任务也第一)。而且这次还是双冠王,除了总榜(唯一分数上1300),在视觉排行榜上也是第一。
2024年8月2日·周五
大模型成私人导游:一键规划 Citywalk,港大 MIT 联合出品
港大MIT等单位联合推出ITINERA,将LLM与空间优化相结合,实现个性化的开放域城市行程规划。举个栗子,用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的citywalk路线”。ITINERA系统立马生成了一条包含若干地点的路线,并提供了相应的介绍文本。
全球首部!欧盟《人工智能法案》正式生效
当地时间周四(8月1日),欧盟《人工智能法案(AI Act)》正式生效。欧盟《人工智能法案》相关规则将分阶段实施,主要是为了给企业一定的过渡期,让它们对相关系统进行修改;《人工智能法案》的影响远远超出了欧盟,它适用于在欧盟有任何业务或影响的任何组织。
360联合国内15家最强大模型推出「AI助手」能力碾压GPT4o
ISC.AI 2024第十二届互联网安全大会人工智能峰会上,360集团创始人,ISC大会主席周鸿祎在《大模型强强联合,让AI普惠10亿+用户》演讲,他指出,大模型不是产品,大模型能力要结合场景才能真正发挥价值,要找到高频、刚需、有痛点的AI明星场景。因此,周鸿祎宣布,360开放安全卫士、安全浏览器、搜索、智能硬件四大国民级场景,打造新一代AI产品“AI助手”,用户可一站式体验国内最强的15家大模型。
2024年8月1日·周二
iPhone 可跑 2B 小钢炮:谷歌 Gemma 2 小模型来袭,跑分超 GPT-3.5
谷歌 DeepMind 的小模型,又上新了!就在刚刚,谷歌 DeepMind 发布 Gemma 2 2B。它是从 Gemma 2 27B 中蒸馏而来。虽然它的参数只有 2.6B,但在 LMSYS 竞技场上的得分,已经超越了 GPT-3.5 和 Mixtral 8x7B!
大模型热钱汹涌:半年百个亿级融资,最高超500亿元
2024年上半年,加上刚刚过去的7月期间, 全球围绕大模型产业链关键环节展开的超亿元融资达到超120起,融资总额粗略估计超2300亿元。 其中美国和中国“遥遥领先”,分别有59起和35起亿元级融资。美国大模型产业相关企业总融资额 超1800亿元 ,中国大模型产业相关企业总融资额在数量上差距较大, 超300亿元 ,但仍位居第二。
Midjourney V6.1新版本上线即爆火:优化远景人脸,细节更丰富
时隔半年,Midjourney带来重磅更新,现在已开放体验。v6.1在8个方面进行升级。一句话总结,就是让生成图像看上去更好看。而且再下一个版本马上就会发布,官方表示v6.2可能在下月和大家见面,将会做更多升级,比如文字方面。
360 集团创始人、董事长兼 CEO 周鸿祎宣布 360 安全大模型免费
在今天举办的第 12 届互联网安全大会上,360 集团创始人、董事长兼 CEO 周鸿祎宣布 360 安全大模型免费。周鸿祎更称 360“要把大模型拉下神坛”,不希望大模型成为少数厂商奇货可居赚钱的工具,让每个企业都“用得起、用得好”。
2024年7月31日·周三
人形机器人「星尘智能」获数千万美元Pre-A轮融资,专注AI机器人商业化
AI机器人公司星尘智能(Astribot)宣布完成数千万美元Pre-A轮融资,由经纬创投领投,道彤投资及清辉投资等产业资本跟投,老股东云启资本跟投。华兴资本担任独家财务顾问。本轮融资将用于顶尖人才招募、研发投入、商业化部署等工作。
被指过度抓取内容后,AI 搜索公司 Perplexity 和出版社达成协议
AI 搜索公司 Perplexity 在被指控过度抓取数据数周之后,公司推出了新的合作计划,向出版合作伙伴分享广告收入。Perplexity 的“出版商计划”已经招募了第一批合作伙伴,其中包括《时代》、《明镜周刊》、《财富》、《企业家》、《得克萨斯论坛报》和 Automattic(WordPress.com 参与其中,但不包括 Tumblr)等知名企业。
OpenAI向部分用户开放GPT-4o语音模式 今秋将扩大至所有付费用户
OpenAI周二宣布,即日起开始向部分 ChatGPT Plus用户推出GPT-4o的语音模式;目前GPT-4o语音模式可使用四种预设声音,Juniper、Breeze、Cove和Ember,这些声音是与付费配音演员合作制作的。
京东云八大 AI 产品发布:编程助手 JoyCoder、言犀数字人 3.0 等
2024 京东云峰会昨日在上海举行。会上,京东云展示了京东言犀大模型落地行业的技术与最新实践,并发布京东云企业大模型服务、言犀智能体平台、智能编程助手 JoyCoder、言犀数字人 3.0 等八大产品。
Meta开源「分割一切」2.0模型,视频也能分割了
Meta 在 SIGGRAPH 上重磅宣布 Segment Anything Model 2 (SAM 2) 来了。在其前身的基础上,SAM 2 的诞生代表了领域内的一次重大进步 —— 为静态图像和动态视频内容提供实时、可提示的对象分割,将图像和视频分割功能统一到一个强大的系统中。
Runway Gen 3 Alpha 模型的图生视频功能正式上线
Runway Gen 3 Alpha 模型的图生视频功能正式上线!用户可以使用任何图片作为视频生成的首帧。上传的图片既可以单独使用,也可以使用文本提示进行额外指导。目前,Gen 3 Alpha 支持生成的视频最长为 11 秒。作为一项重大更新,Runway 表示,图生视频功能将极大提高了生成视频的艺术控制和一致性。
Meta推出AI Studio工具:打造个性化AI聊天机器人
7月30日,Meta Platforms公司宣布推出一款名为AI Studio的新工具。该工具基于Llama 3.1模型构建,提供用户创建、分享和设计个性化AI聊天机器人的功能。用户还可以在社交媒体平台上分享他们设计的人工智能角色。
2024年7月30日·周二
数据安全看得见:苹果 Apple Intelligence 提供详细隐私报告
苹果公司在 iOS 18.1 和 macOS Sequoia 15.1 的首个测试版中推出了名为“Apple Intelligence”的新 AI 功能的预览。该公司不仅详细介绍了这些功能的工作原理和背后的隐私机制,还允许用户查看一份详细的隐私报告,了解 Apple Intelligence 如何处理他们的请求。
逛遍 ChinaJoy,发现 AI 对游戏产业的四个改变
7 月 26 日到 29 日,是一年一度的 ChinaJoy。从游戏行业最大的盛事,发展到游戏、消费电子、娱乐应用的综合狂欢,每年的 ChinaJoy,都是海内外游戏相关从业人士集中交流的重要节点,也是游戏行业向外打开的一个窗口,充满试玩、游戏周边的展台每年日均能吸引到 5 万年轻人逛展。
创业3个月估值超70亿,李飞飞AI新公司成最快独角兽
近日,据报道,著名计算机科学家、美国国家工程院院士、美国国家医学院院士李飞飞创办的AI公司 World Labs,日前已完成两轮融资,最新一次融资额约1亿美元,公司最新估值已达10亿美元(约合72.6亿元人民币)。
巴黎奥运会用上大模型
2024年巴黎奥运会,目前已预定的远程服务中有三分之二通过云计算,奥运转播云将基于阿里云部署在全球的公共云基础设施;AI相关技术在服务跳水、游泳、田径、体操、蹦床、攀岩等多支国家队的日常训练和巴黎奥运会备战工作,无人机表演、比赛用球、各国运动员装备等都有中国厂商身影。
亚马逊云发布Amazon Q Apps:允许用户构建自己的生成式 AI 应用程序
亚马逊云科技近日宣布了多项新技术和新服务,旨在使构建AI应用更加便捷。Amazon Q Apps:这项服务允许用户根据简单描述创建应用程序,即便没有技术背景也能轻松使用。Amazon Q Apps是Amazon Q Business的一部分,能够支持软件开发、数据分析洞察和内容创作等多种任务。
豆包大模型日均tokens使用量超5000亿,AI生图玩法猛猛上新
近日,国产大模型「顶流」—— 字节跳动 豆包大模型 ,迎来一场集中放送:在 2024 火山引擎 AI 创新巡展成都站活动上,豆包大模型团队公布了豆包大模型的最新进展,以及文生图模型、语音模型等垂直模型的新升级。与此同时,豆包大模型家族的最新成员 ——「豆包・图生图模型」正式面世,一口气上新了 50 多项玩法。
2024年7月29日·周一
一年三轮,AI图像生成平台LiblibAI完成数亿元融资
AI图像生成平台 “LiblibAI哩布哩布AI”在至今的一年内,已经完成了三轮融资,总金额达数亿元人民币:天使轮投资方为源码资本、高榕创投和金沙江创投;第二轮由战略投资方领投;第三轮由明势资本领投;老股东持续多轮加持。其中,远识资本为多轮融资的独家财务顾问。
苹果即将推出的AI功能据悉将晚于iOS 18的首次发布
苹果公司计划在十月将Apple Intelligence作为软件更新的一部分向用户推出。知情人士表示,这意味着AI功能将在原定于9月发布的iOS 18和iPadOS 18发布后几周推出。
Meta AI科学家分享Llama 3.1研发与Llama 4更新方向
1. Llama 3.1的研发考虑了多种因素,如scaling law、训练时间和硬件约束,通过FP8量化实现单节点运行,强调开源社区的力量。2. 在Scaling Law方面,Meta通过增加训练token数和时长,在有限算力下达到过度训练状态,以提升推理表现。3. Llama 4将重点围绕agent技术,Scialom希望通过强大的Llama 3构建复杂的agent系统,扩展多种功能,实现模型互联。
AI 公司 Anthropic 违规爬虫抓取数据引发多个网站不满
据 The Verge 当地时间 26 日报道,Anthropic 公司使用的 ClaudeBot 在短短 24 小时之内,就访问了 iFixit 网站近百万次,此举违反了该网站的使用条款。
2024年7月28日·周日
蔚来发布智能驾驶世界模型NWM:0.1 秒内推演出 216 种可能发生的场景
蔚来发布智能驾驶世界模型NWM(NIO World Model)。据蔚来介绍,它是一个多元自回归生成式的具身驾驶模型,可全量理解数据、具有长时序推演和决策能力,能在100毫秒内推演出216种可能发生的场景。作为生成式模型,NWM还能基于3秒的驾驶视频,生成120秒的想象视频。
天猫精灵合伙人创业,跃然创新推出AI毛绒玩具BubblePal
BubblePal,一个能让毛绒玩具复活的AI硬件。BubblePal是基于AIGC技术的交互式对话玩具,可以让孩子与其进行自由对话,并且对话的角色是孩子耳熟能详的动画形象。
谷歌宣布了一项重磅更新:Gemini 聊天机器人将改由 Gemini 1.5 Flash 驱动
Meta、OpenAI 等大模型厂商密集发力之际,谷歌也宣布了一项重磅更新:即日起,Gemini 聊天机器人将改由 Gemini 1.5 Flash 驱动。与之前的版本相比,窗口长度提高到了 4 倍,响应速度也更快了。新版聊天机器人背后的 1.5 Flash 模型,主打的就是轻量化和速度提升。当然模型回复的质量也有提升,上下文窗口也从原先(基于 1.0 Pro)的 8k 提升到了 32k。
微软现支持开发者微调 Phi-3-mini 和 Phi-3-medium AI 模型
微软公司昨日(7 月 25 日)宣布在 Azure 上支持开发者微调(fine-tune) Phi-3-mini 和 Phi-3-medium AI 模型,针对不同用例提高模型的性能。Phi-3-mini 模型于今年 4 月发布,共有 38 亿参数,上下文长度有 4K 和 128K 两个版本;Phi-3-medium 模型共有 140 亿参数,上下文长度同样有 4K 和 128K 两个版本。
OpenAI 下周开始向 ChatGPT Plus 用户推出 Alpha 版 GPT-4o 语音模式
OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)今天回复网友提问,表示将于下周面向 ChatGPT Plus 用户,开放 Alpha 版本 GPT-4o 的语音模式(Voice Mode),实现无缝聊天。
2024年7月26日·周五
OpenAI发布AI搜索产品SearchGPT,并开放内测候补
OpenAI发布了名为 SearchGPT 的AI搜索产品,并开放候补名单,进行小范围测试。OpenAI创始人兼CEO Sam Altman,已经为新AI搜索产品吹了一波“彩虹屁”:“比起传统搜索产品,我对这(SearchGPT)的喜爱程度和适应速度令人惊喜。”
消息称 OpenAI 公司 2024 年资金缺口达到 50 亿美元
报道称截至今年 3 月,OpenAI 公司花费近 40 亿美元使用微软服务器为 ChatGPT 运行推理工作负载;此外 OpenAI 今年训练 ChatGPT 以及新 AI 模型的成本预估达到 30 亿美元,因此训练和推理 AI 的成本可能达到 70 亿美元。OpenAI 最近每月的总收入为 2.83 亿美元,这可能意味着全年销售额在 35 亿至 45 亿美元之间。这意味着 OpenAI 公司今年面临 50 亿美元的资金缺口,很可能需要在未来 12 个月内启动新一轮融资。
2024年7月25日·周四
估值超200亿元,百川智能完成50亿元A轮融资,北上深国资入局
大模型初创公司「百川智能」已于近期完成A轮融资,总融资金额达50亿元人民币。此前,百川智能已经在2023年10月官宣了A1轮融资,披露了包括阿里、腾讯、小米等科技巨头及多家顶级投资机构在内的名单。在A轮融资中,除了上述机构,百川智能还获得了包括北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等国资背景产业投资基金的投资。
AI带动软件收入大涨 IBM财报超预期
IBM公布了强于分析师预期的第二季度业绩报告。报告公布后,该公司股价在周三的盘后交易中一度上涨5%。截至发稿,盘后涨幅收窄回3%。得益于与人工智能相关的软件收入增加,这家科技界的蓝色巨人上调了软件业务的年度增长预期。而软件业务也成为该公司主要增长动力。
1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型
AI 竞赛日益激烈,Meta 公司昨日推出开源 Llama 3.1 模型之后,法国人工智能初创公司 Mistral 也加入了竞争行列,推出了新一代旗舰模型 Mistral Large 2。与 Llama 3.1 的 4050 亿个参数(即指导其性能的内部模型设置)相比,它的参数数量较少,但性能仍接近前者。官方称其为 GPT-4 级模型,在多项基准测试中的性能非常接近 GPT-4o、Llama 3.1-405 和 Anthropic 的 Claude 3.5 Sonnet。
扎克伯格深度专访:中美AI竞争完全错误,美国别想长期领先中国
扎克伯格在本次采访中披露了自己决定构建开源平台的心路历程。他称公司过去一直在开发产品时受制于苹果这样的平台企业,在这波技术浪潮中,他希望通过Meta在AI和VR/AR领域的投资,建立和控制属于自己的平台,并让Meta AI在今年年底前成为使用量最大的AI助手。谈及Llama 3.1,扎克伯格认为这一模型能成为许多企业所需的定制化模型的老师。未来,他计划创造AI社交媒体,帮助人们完成一些比较困难的社交活动。他还透露现在Meta已经在研究Llama 4了。
消息称 Alexa 四年巨亏 250 亿美元,亚马逊豪赌生成式 AI
据《华尔街日报》报道,专注于语音助手 Alexa 的亚马逊业务部门在 2017 年至 2021 年期间亏损高达 250 亿美元(IT之家备注:当前约 1821 亿元人民币)。尽管亚马逊声称售出了超过 50 万台 Alexa 设备,包括 Echo 智能音箱、Kindle 电子书阅读器等,但 Alexa 一直难以盈利。
2024年7月24日·周三
快手AI视频产品“可灵”国际版1.0上线,无需中国手机号码
据Kling AI在社交媒体X上官宣,快手可灵国际版1.0正式上线。只需要邮箱,无需中国手机号码。 立即体验: 可灵国际版
英伟达推出 AI 代工业务:携手 Meta Llama 3.1 开源模型,为客户定制部署“超级模型”
NVIDIA宣布推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务,与刚推出的Meta Llama 3.1系列开源模型一起,为全球企业的生成式AI提供强力支持。Llama 3.1大语言模型有8B、70B和405B三种参数规模。模型在超过16000个NVIDIA Tensor Core GPU上训练而成,并针对NVIDIA加速计算和软件(无论是在数据中心、云以及配备NVIDIA RTX GPU的本地工作站或配备GeForce RTX GPU的PC上)进行了优化。
Alphabet Q2营收利润双双超预期,皮查伊坚信AI将很快创收
受数字广告销售增长和云计算服务需求旺盛推动,谷歌母公司Alphabet周二盘后公布的第二季度(截至6月30日)营收和利润双双超出预期。但该公司表示,今年的资本支出仍将居高不下。第二季度Alphabet的营收增长14%至847.4亿美元,而分析师的普遍预期为841.9亿美元;净利润增长28.6%,至236亿美元,超出229亿美元的平均预期;每股收益为1.89美元,而预期为1.84美元。
快速生成矢量图形,Adobe Illustrator 和 Photoshop 迎来新 AI 功能
Adobe 公司今日宣布,其旗下两款明星软件 Illustrator 和 Photoshop 将迎来一系列基于人工智能的新功能。这些新功能旨在加速日常创作流程,并赋予设计师更多创作控制权。Illustrator 的更新亮点包括“生成式形状填充”功能,用户只需输入简单的文字提示,就能为形状填充上精美的矢量图形。系统甚至可以根据文档中其他元素自动生成填充内容,而且所有生成的图形都是可编辑的矢量图。
2024年7月23日·周二
发力AI产业!沙特阿美向韩国芯片制造商投资1500万美元
沙特阿美风险投资部门Wa’ed Ventures已向韩国芯片制造商Rebellions公司投资了1500万美元;沙特目前正加速发展人工智能产业,这笔投资将有助于沙特在全球技术和创新竞赛中的努力;据悉,Rebellions将利用这笔资金在沙特建立一家新的子公司。
谷歌发布 NeuralGCM 天气预报 AI 模型:运行成本更低、预测更准
谷歌公司最新发布了名为 NeuralGCM 的全新 AI 模型,结合机器学习和传统技术,构建了全新的 AI 天气预测模型,相关成果于昨日发表在《Nature》期刊上。谷歌公司表示相比较其它纯粹基于机器学习的天气预报模型,NeuralGCM 的特点在于成本更低,在预报未来 1-10 天天气方面准确度更高。
开源 AI 模型挑战闭源里程碑?Meta Llama 3.1-405B 多项跑分超越 OpenAI GPT-4o
网友在 LocalLLaMA 子 Reddit 板块中发帖,分享了 4050 亿参数的 Meta Llama 3.1 信息,从该 AI 模型在几个关键 AI 基准测试的结果来看,其性能超越目前的领先者(OpenAI 的 GPT-4o)。这是开源人工智能社区的一个重要里程碑,标志着开源模型可能首次击败目前最先进的闭源 LLM 模型。
马斯克宣布全球最大AI训练集群:年底开发出全球最强AI
马斯克昨日在社交平台X上发文宣布xAI团队、X团队、英伟达及支持公司于当地时间凌晨4点20分开始在“世界上最强大的AI训练集群”——孟菲斯超级集群上进行训练。该集群在单个RDMA fabric上使用10万张液冷H100。马斯克在评论区透露其目标是“今年12月前训练出世界上最强大的人工智能”。
英伟达:或将推出全新“特供版”B20芯片
据报道,英伟达(NVIDIA)正在为中国市场联合开发一款基于Blackwell架构的新款旗舰 AI 芯片,该芯片将符合美国出口管制相关规定,该芯片被命名为“B20”。但报道未提及该AI芯片的性能表现或参数信息。
2024年7月22日·周一
AI 炒菜机器人公司橡鹿科技再获京东近 2 亿元战略投资
据橡鹿科技官方披露,公司再获京东近 2 亿元战略投资并达成全面战略合作。基于双方的 AI 技术和产业优势,二者将共同促进“机器人 +”产业的高质量发展。公司将继续加大研发投入,重点布局视觉、传感器检测等技术在炒菜机器人上的应用。打造的基于视觉的全球领先新一代 AI 炒菜机器人,将于 2025 年正式推出。
权重、代码、数据集全开源,苹果发布 DCLM-7B 小模型
OpenAI 上线小模型 GPT-4o-mini,小模型赛道正式开卷。近期加入这一赛道的还有苹果。最近,苹果公司作为 DataComp-LM(DCLM)项目的研究机构之一,在 Hugging Face 上发布了 DCLM-7B 开源模型。该模型性能已经超越了 Mistral-7B,并且正在逼近其他领先的开源模型,包括 Llama 3 和 Gemma。
欧洲最强 AI 初创公司 Mistral 发布旗下最新最强小模型 ——Mistral NeMo
GPT-4o mini 头把交椅还未坐热,Mistral AI 联手英伟达发布 12B 参数小模型 Mistral Nemo,性能赶超 Gemma 2 9B 和 Llama 3 8B。小模型,成为本周的 AI 爆点。先是 HuggingFace 推出了小模型 SmoLLM;OpenAI 直接杀入小模型战场,发布了 GPT-4o mini。GPT-4o mini 发布同天,欧洲最强 AI 初创公司 Mistral 立马发布旗下最新最强小模型 ——Mistral NeMo。
6GB RAM iPhone 15 也可运行,Hugging Face 推出“SmolLM”小模型家族
如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周 Hugging Face 便公布了“SmolLM”小语言模型家族,其中包含 1.35 亿、3.6 亿及 17 亿参数模型。据介绍,这些模型号称是以精心策划的高质量训练数据集训练而成,号称在 Python 程序编写性能上相当强大,团队指出他们重点优化了模型所需的 RAM 用量,“即使是在 6GB RAM 的 iPhone 15 上也能运行”。
2024年7月19日·周五
谷歌、微软、英伟达等 14 家公司组建安全 AI 联盟
昨日举办的阿斯彭安全论坛(Aspen Security Forum)会议中,谷歌、微软、OpenAI、亚马逊、英伟达、英特尔等 14 家 AI 领域的大公司宣布联合组建安全人工智能联盟(Coalition for Secure AI,CoSAI)。CoSAI 由 OASIS 全球标准机构主办,是一项开源计划,旨在为所有 AI 从业人员和开发人员提供创建设计安全人工智能系统所需的指导和工具。CoSAI 将建立一个合作生态系统,共享开源方法、标准化框架和工具等等。
高盛顶级股票分析师:AI不会掀起经济革命,泡沫总归会破灭
高盛全球股票研究主管Jim Covello新近报告给今年美股上涨的主要推手人工智能(AI)概念泼了冷水。Jim Covello认为,AI带来的经济效益甚至比不上智能手机和互联网;AI是用成本高昂的技术取代低薪工作,这与过去三十年科技业发生过的有变革意义技术转型完全相反。
OpenAI 据称正与博通等公司接洽以研发 AI 芯片
据媒体周四援引知情人士的话报道称,ChatGPT制造商OpenAI正在与包括博通(Broadcom)在内的芯片设计商接洽,共同探讨研发全新的人工智能(AI)芯片。此外,该公司还在招聘前谷歌员工,希望借助其开发Tensor处理器的经验和技术,开发出自家的AI服务器芯片。
英伟达联合发布 Mistral-NeMo AI 模型:120 亿参数、上下文窗口 12.8 万个 token
英伟达联合法国初创公司 Mistral AI,今天发布了全新的 Mistral-NeMo AI 大语言模型,拥有 120 亿个参数,上下文窗口(AI 模型一次能够处理的最大 Token 数量)为 12.8 万个 token。Mistral-NeMo AI 大模型主要面向企业环境,让企业不需要使用大量云资源的情况下,实施人工智能解决方案。
OpenAI 推出性能强大但价格更便宜的 AI 模型 GPT-4o mini
美国人工智能初创公司OpenAI宣布,正式上架价格显著下降的新一代入门级别人工智能“小模型”GPT-4o mini。最新上架的GPT-4o mini则是一个规格更小、更便宜的变体,通过兼具“能力和性价比”,拓展低价位市场的竞争。根据OpenAI披露,GPT-4o mini的API价格将会是15美分/100万Tokens输入,以及60美分/100万Tokens输出。上下文窗口依然是12.8万个Tokens,知识截止日期为2023年10月。
由于监管存在不确定性,Meta 不会在欧盟提供新的多模态AI模型
Facebook母公司Meta Platforms表示,由于欧洲监管环境的不可预测性,将不会向欧盟客户提供其多模态人工智能模型Llama。Meta 打算将新的多模态模型融入多种产品中,包括智能手机和该公司的 Meta Ray-Ban 智能眼镜,该模型能够对视频、音频、图像和文本进行推理。Meta 指出,欧洲企业和机构几乎肯定会失败,因为他们无法获得最新、最好的开放模式。该公司补充称,与世界其他地区相比,欧洲监管机构花了更长的时间来确定法律要求。
2024年7月18日·周四
OpenAI 发布大小模型博弈研究,可让模型输出更易理解
OpenAI的“超级对齐”团队在其解散前发布了最后一篇论文,展示了一种通过大模型与小模型相互博弈的方法来提升AI输出的可读性和准确性。这种方法模仿了多伦多大学学者与2021年提出的“证明者-验证者”(Prover-Verifier)博弈,训练大模型生成易于理解的内容,同时小模型提高其判断力。研究结果表明,这种方法不仅使模型输出更易理解,而且没有明显损失准确率。论文作者之一认为这可能使未来的模型比人类更聪明。
三星收购英国知识图谱 AI 公司 Oxford Semantic Technologies
三星电子周四(7月18日)宣布收购英国的AI初创公司Oxford Semantic Technologies。后者公司主要研发知识图谱技术,能够将信息存储为相互关联的思维网络,方便后期信息检索和推荐。该技术将与三星的设备端AI技术相结合,提供超个性化的用户体验。
通义千问、GPT-4o 等七款 AI 大模型“高考成绩”公布 :前三名文科过一本,理科过二本
上海人工智能实验室 17 日公布了针对 7 个 AI 大模型的高考全科目测试结果。测试结果显示,书生・浦语 2.0 系列文曲星大模型(浦语文曲星)、阿里通义千问大模型 Qwen2-72B 以及 GPT-4o 再次包揽文、理科前三甲;前三名 AI“考生”的文、理科成绩分别超过了“一本”“二本”线(以今年高考人数最多的河南省的分数线为参考)。
具身智能科技公司「小雨智造」获小米、智源等投资
据36氪报道,小米集团和机器人泰斗王田苗,投了一家具身智能科技公司「小雨智造」。该公司2023年2月成立 ,成立之后陆续完成了亿元种子轮融资,由小米集团、机器人泰斗王田苗、北京智源研究院出资。据了解,「小雨智造」的核心创始团队也曾是小米曾经的高层:「小雨智造」创始人乔忠良是小米的初创成员之一,曾经是MIUI研发负责人,负责过MIUI 9到MIUI 12等产品,于2023年1月从小米离职;其联合创始人王文林,曾任职小米软件系统平台部总经理,主导了“小米大脑”和IoT系统的开发。团队其他成员来自于小米、华为、字节跳动、微软等公司。
苹果回应使用 YouTube 资源训练 AI:未用于 Apple Intelligence
据 9to5Mac 报道,针对苹果、英伟达等公司使用未经授权的YouTube 视频训练 AI 大模型一事,苹果今天发表回应。苹果表示,苹果使用这个数据集来训练其开源的 OpenELM 模型,而该模型仅用于研究,OpenELM 并不支持其任何人工智能或机器学习功能,包括 Apple Intelligence。该模型以开源方式发布,可广泛获取,包括在苹果的机器学习研究网站上。
微软发布 iOS / 安卓正式版 Designer 应用:可 AI 修图、生成贺卡等
在经历了长达近 1 年的预览测试之后,微软公司正式在苹果 iOS 平台、谷歌安卓平台推出 Microsoft Designer 应用,让 iPhone 和安卓手机用户体验 AI 修图等功能。
Anthropic与风投Menlo Ventures联手推出1亿美元AI基金
Anthropic与Menlo Ventures联手推出一只价值1亿美元的基金,从而向早期阶段的AI初创公司提供资金支持和Anthropic的AI技术。这个基金效仿了2008年苹果公司和Kleiner Perkins合作推出的iFund。iFund取得了巨大的成功,它让苹果公司能够深入了解早期开发者的需求,并且让苹果知道需要更加关注哪些方面。
DeepL 推出新一代翻译编辑大型语言模型:译文受青睐度达 ChatGPT-4 的1.7倍
以其同名机器翻译器闻名的语言人工智能公司 DeepL 德国当地时间昨日宣布推出新一代面向翻译和编辑应用的大型语言模型。DeepL 宣称基于新模型的译文受语言专家的青睐程度是谷歌翻译的 1.3 倍,ChatGPT-4 的 1.7 倍,微软翻译的 2.3 倍。
谷歌发布 AI 智能体平台 Oscar,用于维护开源项目
在印度班加罗尔谷歌 I/O Connect 开发者活动期间, Go 语言开发团队宣布推出 Oscar ,这是一个用于构建 AI 智能体的开源平台,可以帮助软件产品团队监控问题或错误。通过 Oscar 项目,开发者可以创建在整个软件开发生命周期中发挥作用的 AI 智能体。这些智能体可以是开发者智能体、规划智能机、运行时智能体或支持智能体。
MIT 研究:生成式 AI 更像是记忆大师而非推理高手
麻省理工学院计算机科学与人工智能实验室(CSAIL)的一项最新研究指出,大型语言模型(LLM)似乎更依赖记忆而不是真正的推理能力。研究结果表明,AI 在训练有素的领域内可以达到甚至超越人类水平,但这更多的是一种“记忆力”的体现。一旦面对全新的挑战,需要真正的推理能力时,AI 的优势便不再明显。
李飞飞旗下AI初创企业World Labs估值已超10亿美元
据英国《金融时报》援引知情人士称,著名华裔计算机科学家李飞飞创办的“空间智能”创企World Labs估值已经赶超10亿美元。该创企主要利用类似人类的视觉数据处理技术,使AI具备高级推理能力。据两位知情人士透露,从今年4月成立至今,World Labs已经进行了两轮融资,投资方包括顶级科技投资者Andreessen Horowitz和AI基金Radical Ventures。据了解,其最新一轮的融资金额可能达到约1亿美元。
TrendForce集邦咨询:预估2024年全球AI服务器产值达1870亿美元
根据研究机构TrendForce集邦咨询最新报告,今年大型CSPs(云端服务供应商)预算持续聚焦于采购AI服务器,进而排挤一般型服务器成长力道,相较于AI服务器的高成长率,一般型服务器出货量年增率仅有1.9%。而AI服务器占整体服务器出货的比重预估将达12.2%,较2023年提升约3.4个百分点。若估算产值,AI服务器的营收成长贡献程度较一般型服务器明显,预估2024年AI服务器产值将达1870亿美元,成长率达69%,产值占整体服务器高达65%。
2024年7月17日·周三
美 FTC 对亚马逊与 AI 初创公司 Adept 的交易展开非正式调查
美国联邦贸易委员会(FTC)已经对亚马逊最近宣布的与人工智能初创公司Adept的交易展开了非正式调查。据媒体从一位知情人士处获悉,FTC目前正在寻求有关这份协议的更多信息,该协议涉及亚马逊聘请关键高管并从Adept获得技术许可。亚马逊上月宣布与Adept达成协议,将从Adept公司聘请顶尖人才,并获取该公司的技术。
特朗普盟友起草AI行政命令,启动“曼哈顿计划”
据外媒报道,前美国总统唐纳德·特朗普的盟友正在起草一项全面的人工智能行政命令,该命令将启动一系列“曼哈顿项目”,以开发军事技术,并立即审查“不必要和繁琐的法规”。这表明特朗普第二届政府可能会推行有利于硅谷投资者和公司的人工智能(AI)政策。
消息称字节将于 7 月 19 日大范围分享文生图 / 视频等 AI 模型进展
据钛媒体报道,字节跳动团队将会在7月19日(本周五)大范围分享文生图、类sora新视频等全新人工智能(AI)模型技术进展,尤其在长视频、高动态方向上具备创新技术。一位消息人士表示,字节跳动内部将 AI 大模型设为集团P0最高级别的方向。另一位消息人士则指出,除了上述研究团队之外,抖音、剪映等内部多个团队也在研发 AI 视频模型应用,预计将在近期公布。
Anthropic 推出 Claude Android 版,支持实时翻译
OpenAI竞争对手Anthropic于周二推出了AI聊天机器人 Claude App 的Android版应用程序,希望通过在更多平台上提供Claude来说服用户放弃ChatGPT。Claude Android应用程序将与5月发布的iOS版本运作模式相同,用户可免费访问Anthropic最佳的AI模型Claude 3.5 Sonnet,并通过Anthropic的Pro和Team订阅升级计划。用户将能够在设备间同步他们与Claude的对话,并可以将照片或文件上传到应用程序进行实时图像分析。
Mistral AI 推出两款新模型:数学模型和基于 Mamba 架构的代码生成模型
法国人工智能初创公司 Mistral AI推出了两个新模型:一个基于数学的模型 MathΣtral,以及一个基于 Mamba 架构的供程序员和开发人员使用的代码生成模型 Codestral Mamba。在基准测试中,Mistral 称 Codestral Mamba 在 HumanEval 测试中的表现优于竞争对手开源模型 CodeLlama 7B、CodeGemma-1.17B 和 DeepSeek。
OpenAI 联合创始人 Karpathy 宣布创办 AI 教育初创公司
OpenAI联合创始人、前特斯拉AI总监Andrej Karpathy宣布创立AI原生学校项目Eureka Labs,旨在通过”教师+AI”共生模式,提供个性化AI教育。首个课程”LLM101n”将教授构建类似ChatGPT的大模型,课程内容免费,代码已在GitHub公开。
科技巨头被曝未经授权用 YouTube 内容训练 AI,苹果、英伟达在列
据 Wired 报道,包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意,就使用了他们视频的字幕文件来训练人工智能模型。据悉,超过 17.3 万个来自 4.8 万个频道的 YouTube 视频字幕文件被用来训练人工智能模型,其中就包括苹果、英伟达、Salesforce 等硅谷巨头。
2024年7月16日·周二
英国监管机构出手,正调查微软与 Inflection AI 相关交易
英国竞争和市场管理局(CMA)7 月 16 日发布声明称,正调查微软雇佣 Inflection AI 部分前员工以及与 Inflection 方面达成相关安排的情况。该监管机构担心此举可能导致“竞争实质性减少”。CMA 在声明中表示,做出第一阶段决定的截止日期为 9 月 11 日,届时该机构将宣布是否将此案转入第二阶段的深入调查。
腾讯元宝首发3D生成应用,一张图即可生成3D角色
腾讯旗下大模型应用“ 腾讯元宝 ”上线了“3D角色梦工厂”玩法,腾讯元宝也是首个拥有打印级3D生成能力的通用大模型App。通过“3D角色梦工厂”,只需上传一张五官清晰的正面头像,并选择不同角色模版,就能迅速生成个人3D角色。
微软为 Excel 等研发新 AI 模型:性能较常规方案提高 25.6%,词元使用成本降低 96%
根据微软最新公布的研究论文,计划为 Excel、谷歌 Sheets 等电子表格应用程序,开发全新的 AI 大语言模型–SpreadsheetLLM。研究人员表示现有电子表格应用程序具备丰富的功能,在布局和格式方面为用户提供大量的选项,因此传统 AI 大语言模型很难胜任电子表格处理场景。而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型,微软还研发了 SheetCompressor(压缩电子表格),让 SpreadsheetLLM 能够更好地理解、处理电子表格数据。
机构揭秘OpenAI年收翻倍奥秘 付费用户数已接近千万级别
上周,调研机构FutureSearch发布了一份报告,其对OpenAI公司的收入组成进行了分析,提供了一个更清晰的收入结构图。一个月前,OpenAI首席执行官奥尔特曼对公司员工表示,从过去半年的情况来看,公司今年的收入有望达到34亿美元,较媒体报道的2023年收入(16亿美元)实现了翻倍。
谷歌 Gemini AI 遭质疑:未经用户同意读取 Google Drive 文档
据 X 用户 @Kevin Bankston 的报告,谷歌的人工智能服务 Gemini AI 似乎在未经用户明确许可的情况下读取 Google Drive 中的私人文档。Bankston 最初发现 Gemini 似乎在阅读他的 Google Drive 文档,但相关设置中找不到禁用该功能的选项。经进一步调查,他发现这是 Google Drive 本身的问题,而非 Google Docs,但两者可能都存在类似的漏洞。
谷歌DeepMind被曝抄袭开源成果,论文还中了顶流会议
大模型圈再曝抄袭大瓜,这回,“被告”还是大名鼎鼎的谷歌DeepMind。“原告”直接怒喷:他们就是把我们的技术报告洗了一遍!谷歌DeepMind一篇中了顶流新生代会议CoLM 2024的论文被挂了,瓜主直指其抄袭了一年前就挂在arXiv上的一项研究。开源的那种。
日本总务省:中国对ChatGPT等生成式AI应用,全球第一
日本总务省(类似国务院)在官网发布了,2024年(令和6年)生成式AI应用白皮书。主要查看了日本公民对ChatGPT、Coplilot、Midjourney、Stable Difusion、Gen-2、MusicGen等10多种生成式AI的应用情况,同时对美国、中国、英国和德国的全球主流使用国家进行了横向调查和对比。结果显示,中国以56.3%的使用率排名第一;美国46.3%排名第二;英国39.8%排名第三;德国34.6%排名第四;日本9.1%第五。在企业对生成式AI的应用方面,中国以71.2%大幅度领先同样排名第一。
人形机器人公司「逐际动力」完成数亿元A轮融资,多巨头领投
通用机器人公司「逐际动力」完成数亿元A轮战略融资,由阿里巴巴、招商局创投、上汽集团旗下尚颀资本领投,原始股东峰瑞资本、绿洲资本和明势资本跟投。「逐际动力」创立于2022年,主要产品包括全尺寸人形机器人、四轮足机器人、双足机器人等,落地应用于智能制造、工业巡检、物流配送、家庭服务等领域。
中国农业大学发布“神农大模型 2.0”:覆盖育种、种植、养殖、农业遥感及气象
第八届智慧农业创新发展国际会议于 7 月 13 日在北京举办,中国农业大学在会议上发布了“神农大模型 2.0”。相比 1.0 版本,“神农大模型 2.0”在图像、声音、视频、文件等多模态交互及智能化推理方面获得提升,使大模型能够覆盖育种、种植、养殖、农业遥感及气象等多个农业应用场景。
2024年7月14日·周日
OpenAI 绝密项目「草莓」曝光,前身为Q*,能实现高级推理
路透社独家报道称,OpenAI 内部正在一个代号为「草莓(Strawberry)」的项目中开发一种新的人工智能模型。该项目的细节此前从未被报道过,而 OpenAI 正努力证明其提供的各类模型能够提供高级推理能力。消息人士称,该文件描述了一个使用草莓模型的项目,其目的是让公司的人工智能不仅能生成查询答案,还能提前规划,以便自主、可靠地浏览互联网,进行 OpenAI 所称的「深度研究」。
消息称 4050 亿参数版 Meta Llama 3 将于 7 月 23 日发布
科技媒体 The Information 本周五发布博文,援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3 405B,在现有 80 亿和 700 亿参数两个版本之外,推出 4050 亿参数版本,号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时,扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型,但当时没有透露太多的信息。
2024年7月13日·周六
美国提出《COPIED法案》,要求标记、验证和检测生成式 AI 内容
7月12日晚,美国参议院官网公布了一个由,Cantwell、Blackburn和Heinrich三位两党国会议员提出新的法案——COPIED Act。该法案的主要目的是,制定完善的规则来标记、验证和检测ChatGPT、Uido、Suno、Midjourney等生成式AI产品,提升生成内容的透明度防止被非法乱用以及保护公众的个人数据和隐私。同时保护记者、歌唱家、演员和其他艺术、商业群体的利益,并保留对违规者非法使用其数据训练AI大模型的法律追究权益。
AI 机械臂初创公司 Standard Bots 获 6300 万美元融资,亚马逊、三星等参投
Standard Bots Inc. 是一家为制造业和物流业开发机械臂的初创公司,该公司已获得 6300 万美元的 B 轮新资金来增强其技术。本轮融资由 General Catalyst 领投,亚马逊工业创新基金、Samsung Next 和几家老投资者也参与了该公司的投资。
亚马逊推出 AI 购物助手 Rufus,可回答客户各种问题
亚马逊宣布其生成式 AI 购物助手 Rufus 经过五个月的小范围测试之后现已面向所有美国客户开放。亚马逊表示,Rufus 旨在帮助您节省时间并做出更明智的购物决策。它可以回答您各种各样的购物需求和商品问题,“就像随身带了一个购物助手一样”。
智谱AI开源推出视频理解模型 CogVLM2-Video
智谱AI的团队提出了一种基于视觉模型的自动时间定位数据构建方法,生成了3万条与时间相关的视频问答数据。然后,基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练了一种新的视频理解模型—CogVLM2-Video。
百度推出仿真人AI社交App“文小言”
据Tech星球报道,百度于近日上线了一款名为“ 文小言 ”的AI数字人社交APP。据悉,该产品基于文心大模型的技术打造,是一款与AI虚拟角色进行实时沟通、互动并建立情感连接的人工智能应用服务。
2024年7月12日·周五
OpenAI 提出通用人工智能五级标准,自认为接近但未达到第二级
报道称,OpenAI 提出通用人工智能五级标准,用来确认人工智能的进展。OpenAI 高管告诉员工,公司自认为目前还处于第一级,但即将达到第二级。第一级:聊天机器人,具有会话语言的人工智能;第二级:推理者,解决人类水平问题的人工智能;第三级:代理,能够代表用户采取行动的人工智能;第四级:创新者,能够帮助发明的人工智能;第五级:组织者,能够完成组织工作的人工智能。
尘埃落定,英国 AI 芯片企业 Graphcore 已被软银收购
根据 Graphcore 官网,这家正处困境的英国 AI 芯片企业已被软银收购。Graphcore 将成为软银的全资子公司,继续以现有名称运营。Graphcore 曾一度被视为“英国版英伟达”。然而自 2020 年以来,该企业未获得新的融资,也丢失了来自微软的重要订单,这使其资金紧张、运营困难,未能跟上 AI 芯片领域的大势。
2024年7月11日·周四
三星承诺:今年将在全球2亿台设备上推出Galaxy AI
今年早些时候,三星在Galaxy S24上推出了一套由人工智能驱动的功能Galaxy AI。在昨晚的Galaxy Unpacked活动上,三星宣布到2024年底,Galaxy AI将在全球2亿台设备上推出。由于Galaxy AI已在现有兼容设备上推出,可以推测三星正在计算Z Flip 6、Z Fold 6、Buds 3、Buds 3 Pro、Watch 7和Watch Ultra的可能得销量,最终得出了“2亿”这个数字。
美 FTC 正在对微软和 OpenAI 的投资交易进行反垄断审查
据路透社报道,微软、苹果公司计划放弃了其在 OpenAI 董事会的观察员席位。报道称,此举旨在缓解美国和英国反垄断监管机构对其在生成式 AI 日益普及的背景下对OpenAI进行垄断控制的担忧。但是,美国联邦贸易委员会(FTC)的一位消息人士周三表示,这一变化不太可能解决美国政府的担忧,FTC正在对微软和OpenAI的投资交易进行反垄断审查,因为此举表明微软看到了巨大的潜在反垄断风险,并正试图抢占先机。
三星今年将推出升级版语音助手Bixby 配备自家大模型
三星移动业务负责人在接受最新采访时表示,该公司将在今年推出基于自己人工智能(AI)模型的升级版语音助手Bixby。此前就有报道称,三星正在研发升级版Bixby,而此次是该公司首次确认发布时间。Bixby的升级反映了三星正在其设备套件上更加努力地推广人工智能功能。此外,除了自家的Bixby外,三星还将继续允许其他的语音助手在其设备上运用。例如,谷歌的人工智能助手也可以在三星的最新设备上使用。
AMD 以 6.65 亿美元收购芬兰 AI 初创公司 Silo AI,欲与英伟达争锋
芯片巨头 AMD 周三宣布,将斥资约 6.65 亿美元现金收购芬兰人工智能初创公司 Silo AI。此举旨在增强其人工智能芯片能力,与行业领导者英伟达竞争。AMD 表示,收购 Silo AI 将帮助其改进 AMD 驱动的人工智能模型的开发和部署,并帮助潜在客户使用 AMD 的芯片构建复杂的人工智能模型。同时,Silo AI 还将加强 AMD 的软件开发能力。
夸克升级“超级搜索框”,推出AI搜索为中心的一站式AI服务
7月10日,夸克升级“超级搜索框”,推出以AI搜索为中心的一站式AI服务,为用户提供从检索、创作、总结,到编辑、存储、分享的一体化信息服务价值。一个“超级搜索框”实现回答、创作、总结之外,夸克一站式提供网盘、扫描、文档、CueMe、学习助手、健康助手等内容产品和智能工具。
2024年7月10日·周三
阿里旗下的AI搜索助手心流正式上线,小程序版本、APP版本也将推出
专为科研人员、高校教师和学生、职场人士研发的大模型应用产品 心流 正式上线。据了解,其产品定位为用户的AI搜索助手,提供智能搜索、知识问答、智能阅读、辅助创作等能力,旨在帮助用户提升工作和学习效率。(AI工具集注:心流的网站备案信息显示,备案主体是杭州万相创意科技有限公司,即“阿里妈妈”的主体)
微软宣布放弃 OpenAI 董事会观察员席位,苹果也不会担任类似角色
微软当地时间周一宣布将放弃在 OpenAI 董事会的观察员席位,称 OpenAI 在过去八个月中取得了“重大进展”,对公司发展方向充满信心,因此不再需要该席位。在一份写给 OpenAI 的信中,微软表示已确认放弃该席位,且即刻生效,微软还表示“感谢 OpenAI 领导层和董事会在这个决策过程中给予的支持”。除微软外,英国金融时报表示苹果也不会在 OpenAI 董事会担任观察员角色。OpenAI 官网显示,它“仍然是一家完全独立的公司,由 OpenAI 非营利机构管理”。
马斯克旗下xAI与甲骨文百亿美元合作谈判破裂,拟自购芯片建数据中心
近期,马斯克麾下人工智能公司xAI与甲骨文之间的协议扩展谈判宣告破裂。原协议中,xAI计划从甲骨文租赁专用的英伟达人工智能芯片。但据知情人士透露,xAI现已决定自主采购芯片,以构建其数据中心基础设施。据悉,xAI原本与甲骨文正就一项多年期的合作协议进行深入探讨,该协议旨在让xAI从甲骨文处租用英伟达芯片,以支持其即将打造的超级计算机项目,预计交易规模可达100亿美元之巨。
谷歌 DeepMind CEO:当前 AI 综合智力还不如普通家猫
谷歌 DeepMind CEO 哈萨比斯出席全球变革研究所组织的“2024 年英国未来会议”,在和英国前首相托尼・布莱尔(Tony Blair)的公开讨论中表示:如果将 AI 作为通用系统来衡量,其 IQ 智商水平甚至没有超过猫。不过,随着巨额现金和计算投资的推动,相关研究进展很快。一些人预计未来 5 年时间,AI 智力可以超过人类。
调查:中国在生成式人工智能应用和普及方面全球第一
周二公布的一项最新调查显示,中国在生成式人工智能(GenAI)的应用和普及方面走在世界前列。根据美国人工智能和分析软件公司SAS以及Coleman Parkes Research对全球各行业1600名决策者进行的调查,83%的中国受访者表示他们已采用了生成式人工智能。
Gartner:64% 受访者不希望客服系统部署
AI 市场调查机构 Gartner 今天发布调查报告,表示 64% 的受访客户不希望客服使用 AI。该调查还指出 53% 的客户如果发现某家公司客服使用 AI,会考虑转向竞争对手。
OpenAI CEO 奥特曼与赫芬顿成立一个新的AI健康公司
OpenAI CEO Sam Altman 与AI医疗健康巨头Thrive Global的CEO阿里安娜·赫芬顿(Arianna Huffington)一起在《时代》杂志上发表了一篇文章,正式宣布了Thrive AI Health公司的成立。Thrive AI Health的目标是打造一个个性化“AI健康教练”,以手机App形式呈现。目前公司CEO是谷歌前健康和可穿戴设备负责人德卡洛斯·洛夫(DeCarlos Love),OpenAI创业基金和Thrive Global是主要投资方。
2024年7月9日·周二
腾讯智影小程序上线 AI 视频功能,限时免费一键生成风格化视频
腾讯智影小程序上线了智影 AI 视频功能,可以一键生成风格化视频,目前有日漫风格可选,此功能限时免费(未公布收费价格)。视频风格化就是在原视频的基础上进行风格化处理,官方称风格化视频可以提升视频美感、增强趣味性、提升传播力。只需导入视频并一键“变身”,就能快速生成风格化视频(支持 10s 视频),智影 AI 提供了多种模板,让视频更加多样化。
AI 文档搜索公司 Hebbia 宣布完成 1.3 亿美元融资
周一,位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资,由 a16z 领投,Index Ventures、Google Ventures 以及 Peter Thiel 参投。据悉,Hebbia 目前估值约为 7 亿美元,公司成立于 2020 年,其软件可分析数字化文档和数据源,包括监管文件、PDF 以及音频和视频剪辑,以帮助客户处理比面向消费者的聊天机器人更复杂的查询,类似 Glean。
中国工程院院士郑纬民:国产AI芯片核心问题是生态不够好,如果好60%的性能也有人用
7月7日信息化百人会(ChinaInfo100,信百会)2024年度研讨会上,中国工程院院士、清华大学计算机科学与技术系教授郑纬民发表演讲。郑纬民表示,AI 大模型正在从单模态向多模态发展,同时应用也很多,这使得算力爆发性增长,算力一直供不应求。但同时,相比英伟达,国产 AI 芯片系统生态不够好。
古尔曼:苹果首款支持 Apple Intelligence 的智能家居设备将是一款桌面机器人
据彭博社记者马克・古尔曼 (Mark Gurman) 透露,苹果首款搭载 Apple Intelligence 功能的智能家居设备将是一款全新的桌面机器人。古尔曼表示,期待在现有苹果智能家居设备上使用 Apple Intelligence 功能的用户可能要失望了,他们需要等待苹果推出 AI 驱动的桌面机器人产品。
2024年7月8日·周一
Anthropic 首席执行官:未来三年内,AI 大模型训练成本将上升至百亿甚至千亿美元
据 Tom’s Hardware 今日报道,AI 初创公司 Anthropic 的首席执行官 Dario Amodei 近期接受播客节目采访时表示,目前像 GPT-4o 这样的模型训练成本约为 1 亿美元,而目前正在开发的 AI 大模型训练成本可能高达 10 亿美元。当然,10 亿美元还不是“终点”。Dario Amodei 作出预测,未来三年内,AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元。
MOSS大模型项目负责人邱锡鹏:大模型的下个阶段是“世界模型”
复旦大学教授、MOSS大模型项目负责人邱锡鹏认为,当前,大语言模型还存在很多不足。比如在落地阶段,大语言模型的会遇到难以解决的“幻觉问题”,即生成不真实、不可靠、不存在的信息。邱锡鹏将大模型的未来趋势和发展方向,总结为观察世界、产生动作,并走向“世界模型”。
曝苹果 Apple Intelligence 版全新 Siri 今年不会推出
根据彭博社记者马克·古尔曼的最新消息,苹果公司今年不会推出全新的Apple Intelligence驱动的Siri。相反,该公司计划在明年1月开始测试,并在iOS 18.4中推出正式版本。此前报道显示,苹果公司在6月11日的2024年WWDC全球开发者大会上正式宣布了这款新Siri。
X 被曝将新增多项 Grok 模型功能支持,含聊天机器人侧面板
独立应用程序研究者 Nima Owji 表示,X 社交平台正在开发多项基于 xAI Grok 模型的功能,为 X Premium 订阅用户提供更丰富的使用体验。其中之一便是类似于其他生成式 AI 聊天机器人的 Grok 侧面板,用户可在使用 X 平台任意功能时同 Grok 机器人交流。
月之暗面为 Kimi 智能助手推出官方浏览器插件
据月之暗面官方微信公众号消息,月之暗面推出 Kimi浏览器插件 ,并为网页用户带来多项新功能。Kimi 插件,目前只有两个按钮:一个是点问笔,划选文字后就会出现;另一个是总结器,出现在网页右下角,帮你快速总结全文、答疑解惑。
2024年7月6日·周六
消息称黑客去年曾侵入OpenAI内部系统,部分AI设计细节被盗
据媒体援引知情人士透露,一名黑客去年曾成功“黑入”了OpenAI的内部消息系统,并窃取了该公司人工智能技术的设计细节。OpenAI高管在去年4月的全体员工大会上向员工和公司董事会通报了这一漏洞,但高管决定不对外公开这一消息。
商汤科技发布日日新5.5大模型体系
商汤发布日日新5.5大模型体系,包括6000亿参数基础模型日日新5.5,性能提升30%;流式多模态交互模型日日新5o,是国内首个所见即所得模型,可进行实时多模态交互和问答;日日新5.5Lite在端侧模型进行升级,模型精度提升10%、首包延迟降低40%,推理效率提升15%。
软银集团宣布4亿英镑收购AI芯片公司Graphcore
近日,日本软银集团宣布将以4亿英镑收购陷入困境的人工智能初创公司 Graphcore,该交易还需要获得英国政府的审查批准才能生效。资料显示,Graphcore成立于2016年,生产称为智能处理器单元(IPU)的AI芯片,旨在挑战英伟达。由于英伟达的设备需求量很大,投资者们纷纷向这家初创公司注入资金,寻找替代英伟达的可行方案。2020年,Graphcore以28亿美元的估值筹集2.22亿美元,使其成为英国最有前途的初创公司之一。
王坚:美国AI发展的电力瓶颈短板我国不存在,最不缺就是电
近日,中国工程院院士、阿里云创始人王坚公开表示,美国AI人工智能发展的瓶颈是电力,这对中国来说不是问题。2024世界人工智能大会上,中国工程院院士、阿里云创始人王坚回答算力和电力是否是AI发展瓶颈,表示电力方面,中国是最不用担心的。“中国一年的发电量是美国、日本、俄罗斯的总和还要多”,王坚说道。另外他提出一个应用、模型、电力和算力的不等式,认为在此不等式下,目前从事人工智能的人还不用担心瓶颈问题。
2024年7月5日·周五
阿里云 CTO 周靖人:通义真正实现全尺寸、全模态开源,下载量已破 2000万
7 月 5 日,在上海世界人工智能大会上,阿里云 CTO 周靖人公布近期通义大模型和阿里云百炼平台的最新进展。近 2 个月,通义千问开源模型下载量增长 2 倍,突破 2000 万次,阿里云百炼服务客户数从 9 万增长至 23 万,涨幅超 150%。周靖人重申了阿里云拥抱开源开放的坚定立场,「到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。」
阿里通义 App 上线“追星星的 AI”:国内首个关照孤独症儿童的 AI 绘本
阿里巴巴官方公众号今天下午发文宣布,通义 App 现已上线一款特殊 AI 工具“追星星的 AI”。阿里巴巴表示,这是国内首个关照孤独症儿童的 AI 绘本工具,免费为孤独症儿童家庭提供定制 AI 绘本服务。其基于阿里自研的 Modelscope-Agent 框架,调用了通义大模型的多项服务,可实现从一句话故事梗概到完整有声绘本的生成。
蚂蚁百灵大模型最新进展:已具备原生多模态能力
7月5日,在2024世界人工智能大会“可信大模型助力产业创新发展”论坛上,蚂蚁集团公布了其自研的百灵大模型最新研发进展:百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力,可以直接理解并训练音频、视频、图、文等多模态数据。
支付宝发布多模态医疗大模型,支持千亿级视觉识别
在2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。基于蚂蚁百灵的多模态能力,该模型可实现直接理解并训练音频、视频、图、文等多模态数据,使其更像人一样感知和互动,能“看”会“听”、能“说”会“画”,支持千亿级别参数医疗视觉识别。
文心智能体平台升级,向开发者免费开放文心大模型4.0
据百度官方消息,百度文心智能体平台(AgentBuilder)免费开放了文心大模型 4.0。开发者在文心智能体平台上制作智能体时,可灵活选择文心大模型 3.5 或 4.0 版本。文心大模型 4.0 于 2023 年 10 月发布,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有提升。
B站亮相2024世界人工智能大会,首次展出自研大语言模型
在 2024 世界人工智能大会(WAIC 2024)上,哔哩哔哩(以下简称“B站”)公布了多项自主研发的 AI 技术成果和 AIGC 多元创意,包括最新定制的 AI 语音声库、自研音视频大模型 必剪 Studio 以及自研 AI 动态漫技术等。此外,B站自研的大语言模型系列也在此次 WAIC 2024 大会上首次展出,包括开源的 Index-1.9B chat 和 Index-1.9B character 两个模型。
MiniMax创始人闫俊杰:至少三年后才会出现“杀手级”AI应用
4日下午举行的世界人工智能大会产业发展主论坛上,国内 AI 大模型“独角兽”公司MiniMax创始人兼CEO闫俊杰参与了一场圆桌,并表示,虽然国内很多公司正在迎头赶上ChatGPT,但是目前模型的错误率在60%-70%的水平,远不及GPT-4的30%-40%。会后,闫俊杰在对钛媒体AGI等对话时表示,类似于微信、抖音、今日头条这种规模的“杀手级”AI超级应用(Killer App),至少要到三年之后才能实现。
英伟达今年在华销售额预计将达120亿美元,发货超100万颗芯片
芯片咨询公司SemiAnalysis报告预估,今年英伟达有望在中国销售价值约120亿美元的人工智能芯片。黄仁勋曾表示,希望借助新的芯片使得英伟达在中国的业务实现最大化。英伟达有望在未来几个月内在中国交付超过100万颗定制版H20芯片,这些芯片的设计不受美国对向中国客户销售人工智能处理器的限制。据悉,每颗H20芯片的价格在12000至13000美元之间。
ElevenLabs 推出免费的 AI 语音分离工具,可消除环境噪音
ElevenLabs是一家以语音克隆、 文本转语音和语音转语音模型而闻名的人工智能语音初创公司,最新在其产品组合中添加了另一种工具:AI语音分离工具(AI Voice Isolator)。该产品允许创作者从任何内容(从电影到播客或 YouTube 视频)中消除不需要的环境噪音和声音。
无问芯穹发布全球首个单任务千卡异构芯片混合训练平台,算力利用率达 97.6%
无问芯穹联合创始人兼 CEO 夏立雪昨日在世界人工智能大会 AI 基础设施论坛上发布了无问芯穹大规模模型的异构分布式混合训练系统,称千卡异构混合训练集群算力利用率最高达到了 97.6%。夏立雪还宣布无问芯穹 Infini-AI 云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性。
2024年7月4日·周四
摩尔线程升级夸娥(KUAE)智算集群到首个国产全功能GPU的万卡规模集群
日前,国产GPU公司摩尔线程宣布其人工智能(AI)旗舰产品夸娥(KUAE)智算集群解决方案实现重大升级——从千卡扩展至万卡规模。总算力超过10EFLOPS,目标是做到有效计算效率超过60%、稳定性达99%,能支撑万亿参数级大模型训练。
腾讯混元DiT升级:推出6G小显存版本,支持Kohya训练
腾讯混元文生图大模型( 混元DiT )宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者十分友好,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开发者可以低门槛地训练个性化LoRA模型;同时,混元DiT模型升级至1.2版本,在图片质感与构图方面均有所提升。
特斯拉二代人形机器人Optimus亮相WAIC,行走速度提升30%
7月4日,在2024世界人工智能大会(WAIC 2024)上,特斯拉二代人形机器人Optimus正式亮相。特斯拉相关负责人向上证报记者介绍,二代Optimus在直立行走的基础上,行走速度提升了30%;其手指还“进化”到除了感知和触觉,可以在轻握鸡蛋和搬运重物时做到“游刃有余”。
北京:2025年智算供给规模达45EFLOPS,两年打造AI原生城市
在 7 月 3 日召开的 2024 全球数字经济大会智能计算与决策技术论坛上,北京市经济和信息化局总经济师、数字经济专班执行长唐建国表示:“北京市明确提出,到 2025 年本地智算供给规模达到 45EFLOPS(每秒百亿亿次浮点运算次数),形成北京市内东西南北四个亿级以上算力中心,构建‘京津冀蒙’算力供给走廊,为人工智能大模型的训练和推理应用提供高效的算力供给。”
丘成桐:人工智能要重视上游的基础学科
“人工智能的上游、中游、下游要同步做,上游(基础学科)要领导,中、下游要帮忙,中国尤其要重视上游的工作。”在7月4日上午举行的2024世界人工智能大会暨人工智能全球治理高级别会议全体会议上,菲尔兹奖首位华人得主丘成桐接受第一财经独家采访时表示。
阶跃星辰发布三款Step系列通用大模型新品
在2024年世界人工智能大会上,阶跃星辰发布了三款Step系列通用大模型新品:Step-2万亿参数语言大模型正式版、Step-1.5V多模态大模型、Step-1X图像生成大模型。其中,Step-2大幅提升了训练效率,在数学、逻辑、编程、知识、创作、多轮对话等方面体感逼近GPT-4。Step-1.5V 在图像感知和理解能力上全面提升,并具备较强的视频理解能力。
李彦宏:没有应用,基础模型一文不值,商业化闭源模型最能打
7月4日,在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏谈及,2023年,国内出现了百模大战,造成了社会资源的绝大浪费,但也使得国内追赶世界上最先进的基础模型能力得到建立。李彦宏再次强调闭源模型的优势,称激烈竞争环境下,商业化闭源模型最能打。另外,没有应用,基础模型一文不值。
联发科与快手推出端侧视频生成技术,支持天玑 9300/8300 移动平台
2024年7月4日,MediaTek与快手共同宣布,推出高效端侧视频生成技术,共同探索并推进生成式AI技术的革新。该技术是对2024 世界移动通信大会(MWC 2024)上初次亮相的视频生成技术的延续与提升,结合快手的AI模型I2V(image to video)Adapter与MediaTek天玑9300、天玑8300移动平台强劲的AI算力,在端侧实现由静态图像生成动态视频的创新体验。
商汤发布可控人物视频生成大模型Vimi,实现分钟级视频
世界人工智能大会(WAIC 2024)在上海隆重召开,由商汤科技打造的首个面向C端用户的可控人物视频生成大模型 Vimi 亮相。Vimi基于商汤日日新大模型的强大能力,仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。
法国开源AI研究实验室Kyutai发布对标GPT-4O的实时语音多模态模型Moshi
7月4日凌晨,法国知名开源AI研究实验室Kyutai在官网发布了,具备看、听、说多模态大模型—— Moshi 。Moshi功能与OpenAI在5月14日展示的最新模型GPT-4o差不多,可以听取人的语音提问后进行实时推理回答内容。但GPT-4o的语音模式要在秋天才能全面开放使用,而Moshi已经提供使用了。
三星放缓汽车半导体开发,专注于人工智能芯片
三星负责芯片设计的系统LSI部门正在进行业务和组织重组,将优先发展AI芯片。此次从事汽车处理器“Exynos Auto”(代号KITT3)开发的的人员已在该部门内重新分配到AI系统级芯片(SoC)团队,该团队现在是三星设计工作的重点。目前,该部门集中了100-150名专门设计人员,致力于AI芯片设计。
macOS 版 ChatGPT 被指以纯文本存储 AI 对话,OpenAI 紧急更新修复
开发者 Pedro Vieito 于 2 天前在 Thread 平台发布动态,表示 macOS 版 ChatGPT 应用会以纯文本方式存储用户对话,OpenAI 公司今天回应称已更新其应用,对存储在 Mac 设备上的聊天记录进行了加密处理。
2024年7月3日·周三
巴西政府机构禁止 Meta 公司使用用户数据训练生成式 AI 模型
据美联社报道,巴西国家数据保护局当地时间周二(2 日)认定,拥有 Facebook、Instagram、WhatsApp 等平台的社交网络巨头 Meta 将不得使用来自巴西的数据来训练其生成式 AI 模型。Meta 近期更新了隐私政策,允许公司可将人们的公开帖子用于训练其模型。根据巴西国家数据保护局的公报,Meta 此举将会对受影响数据主体的基本权利造成严重的、不可挽回的或难以修复的损害,此次下达的禁令是“预防性措施”。
世界知识产权组织:过去十年中国生成式AI专利申请量居全球第一
世界知识产权组织发布《生成式人工智能专利态势报告》。报告显示,2014年至2023年,中国发明人申请的生成式人工智能专利数量最多,远超美国、韩国、日本和印度等国。2014年至2023年,全球生成式人工智能相关的发明申请量达54000件,其中超过25%是在去年一年出现的。
Meta 发布 3D Gen AI 模型:1 分钟内生成高质量 3D 内容
Meta 公司昨日(7 月 2 日)发布研究论文,介绍了名为 Meta 3D Gen(3DGen)的全新 AI 模型,可以在 1 分钟内基于用户输入的提示词,生成高质量的 3D 内容。Meta 公司表示 Meta 3D Gen(3DGen)所生成的 3D 内容具备高分辨率纹理和材质贴图,还支持基于物理的渲染(PBR),并能对此前生成的 3D 内容重新再生成新纹理。
苹果公司有望获得 OpenAI 董事会观察员席位
据报道,作为上个月宣布的里程碑式协议的一部分,苹果公司将获得OpenAI董事会观察员职位,这进一步加强了两家公司之间的联系。据知情人士透露,苹果应用商店(App Store)负责人、前营销主管Phil Schiller被选中担任这一职位。这位知情人士说,作为董事会观察员,他不会以正式董事的身份任职。
AI 音乐和歌曲生成平台 Suno 推出 iOS 移动端 APP
Suno 是一款广受欢迎的人工智能音乐和歌曲生成器服务,在网络上已有超过1200万人使用,该公司推出了首款iOS设备移动应用程序。Suno iOS 版允许用户只需提供文字描述或用手机录制音频,就能轻松创建自己的音乐。用户可以生成 4 分钟长的歌曲和 2 分钟长的歌曲扩展。
Runway 正洽谈新一轮 4.5 亿美元融资,估值达 40 亿美元
根据 The Information 最新报道,Runway 正在与 General Atlantic 洽谈新一轮 4.5 亿美元融资,估值达 40 亿美元。2023 年 6 月,Runway 曾从包括 Google、Nvidia 和 Salesforce Ventures 在内的投资者那里筹集了 1.41 亿美元,当时的估值为 15 亿美元。据悉,Runway 在去年年底的 ARR 约为 2500 万美元,比六个月前的几百万美元大幅增加,但仍与 OpenAI 等头部玩家三四十亿美元的收入有较大差距。
AI 编程创企 Magic 正洽谈 2 亿美元融资,估值 15 亿美元
据路透社独家报道,美国AI编程创企Magic正在谈判筹集超过2亿美元的一轮融资,估值为15亿美元,距离其上次融资仅几个月。 包括Jane Street在内的投资者预计将参与这一轮融资,这可能会使Magic的估值比上一轮高出3倍,尽管该公司没有收入,也没有产品出售。
马斯克:xAI 训练 Grok-3 大模型用了 10 万块英伟达 H100 芯片
马斯克已经宣布其人工智能初创公司 xAI 的大语言模型 Grok-2 将于 8 月推出,将带来更先进的 AI 功能。虽然 Grok-2 还没亮相,但马斯克已经开始为其 Grok-3 进行造势。他透露 xAI 的 Grok-3 用了 10 万块英伟达 H100 芯片进行训练,预计将于年底发布,相信它会“非常特别”。
四部门印发《国家人工智能产业综合标准化体系建设指南(2024版)》
工业和信息化部等四部门印发《国家人工智能产业综合标准化体系建设指南(2024版)》。到2026年,标准与产业科技创新的联动水平持续提升,新制定国家标准和行业标准50项以上,引领人工智能产业高质量发展的标准体系加快形成。开展标准宣贯和实施推广的企业超过1000家,标准服务企业创新发展的成效更加凸显。参与制定国际标准20项以上,促进人工智能产业全球化发展。
英伟达被曝面临法国反垄断指控:罚金最高可达60.9亿美元
据外媒报道,法国反垄断监管机构计划指控英伟达涉嫌存在反竞争行为。有知情人士透露,该指控源自法国监管机构去年9月对GPU(图形处理芯片)行业的一次突击检查,而这次检查针对的目标便是英伟达。根据法国反垄断法的规定,违反反垄断法的公司可能面临高达其全球年营业额10%的罚款,但他们也可以做出让步以避免处罚。以英伟达2024财年609亿美元的营收来计算,罚款金额最高可达60.9亿美元(约合人民币442.63亿元)。
Character AI融资困难,计划出售给谷歌和Meta
由谷歌前员工创立的AI独角兽公司Character AI,曾因角色扮演聊天产品而备受瞩目。尽管A16Z曾以10亿美元估值投资1.5亿美元,但随着市场新鲜感消退和竞争加剧,公司面临融资困难,正考虑出售给谷歌或Meta。Character AI与这些科技巨头探讨了潜在合作,包括计算资源和知识产权共享。同时,公司也在寻求新的收入来源,如广告和API访问,以维持增长。
Runway 的文生视频模型 Gen-3 Alpha 向所有人开放
Runway宣布,文生视频模型 Gen-3 Alpha 向所有用户开放使用,每个月最少12美元才能使用。Gen-3一次性只能生成11秒的720P视频,也不会带任何背景音乐,有用户表示Gen-3的功能比Sora更好,并将再次改变文生视频赛道。
OpenAI CEO 奥特曼:GPT-5 将带来“巨大飞跃”
根据 Aspen Ideas Festival 上的一次访谈,OpenAI CEO 奥特曼提到,开发“GPT-5”还需要一些时间。“我们目前持乐观态度,但还有很多工作要做。”奥特曼表示。目前尚不清楚 GPT-5 的发布日期,但奥特曼表示它将是“巨大飞跃(significant leap forward)”,或许是相较于其前辈 GPT-4 而言。此前,奥特曼曾公开表示 GPT-4 “有些糟糕”,并委婉地称之为“充其量只是有点尴尬”。
2024年7月2日·周二
LeyLine 完成首轮数百万美元融资,为创意行业提供一站式AI工作流平台
位于西雅图初创企业「LeyLine」,已于近日完成首轮数百万美元融资,公司致力于推出全球首个针对游戏,短剧,动画,CG等内容制作行业的AI赋能人机混合智能生态系统。本轮融资的领投方为春华创投(春华资本旗下VC),跟投方包括总部位于波士顿的深科技基金Taihill Venture和多位著名天使投资人。
桥水启动由机器学习决策的20亿美元规模基金
对冲基金巨头桥水公司最新推出了一只基金——一只由机器学习运行并进行决策的基金。据了解,该基金从不到10位客户那里获得了大约20亿美元的资金。新投资工具由联席首席投资官Greg Jensen牵头,已于周一(7月1日)开始交易。目前新基金依靠桥水公司研发了十多年的专有技术,据知情人士透露,新基金还将扩大范围,纳入OpenAI、Anthropic和Perplexity等公司开发的模型。
联大通过中国提出的加强人工智能能力建设国际合作决议
第78届联合国大会1日协商一致通过中国主提的加强人工智能能力建设国际合作决议,140多国参加决议联署。该决议强调人工智能发展应坚持以人为本、智能向善、造福人类的原则,鼓励通过国际合作和实际行动帮助各国特别是发展中国家加强人工智能能力建设,增强发展中国家在人工智能全球治理中的代表性和发言权,倡导开放、公平、非歧视的商业环境,支持联合国在国际合作中发挥中心作用,实现人工智能包容普惠可持续发展,助力实现联合国2030年可持续发展议程。
微软 AI 设计工具 Designer 测试定制贺卡功能
微软昨日发布新闻稿,邀请 Microsoft 365 Insider 项目成员,测试 Microsoft Designer 的个性化贺卡“Greeting Cards”功能。微软表示 Greeting Cards 是一款快速、直观的工具,可将用户输入的文字描述转化为符合其独特风格和信息的个性化贺卡。
比尔·盖茨:Scaling Law快要走到尽头,超人AI还需新的突破
比尔·盖茨在一期 Next Big Idea 播客中讨论了人工智能的未来发展,强调其在医疗、教育和生产力中的重要性。他认为AI将深刻影响合成生物学和机器人技术,并预测个人智能体会通过耳机、眼镜等设备与人类交互。盖茨指出,AI的真正进步在于实现更接近人类的元认知能力,而非仅扩大模型规模。他预期AI将提升生产率并改善生活质量,但也提醒需警惕技术发展对社会的影响。
谷歌 Gemini 模型今秋或将融入苹果智能生态系统
苹果知名爆料人马克·古尔曼(Mark Gurman)最新透露,苹果公司将于今年秋季宣布与Alphabet旗下的谷歌的大模型Gemini建立合作关系,届时Gemini模型将有望接入苹果的Apple Intelligence。此外,古尔曼还重申,苹果与人工智能初创公司Anthropic的潜在合作关系也在考虑之中,不过,苹果不会考虑整合Meta公司的人工智能服务。
腾讯元宝上线AI深度搜索,可一键生成脑图、表格
腾讯宣布旗下大模型应用“ 腾讯元宝 ”上线AI深度搜索,更新到最新版本后,腾讯元宝将在AI搜索深度模式下对问题进行扩展,可同步生成内容大纲、思维导图及相关人物事件梳理。
腾讯搜狗输入法上线 AI 对话、AI 宠物、快捷问答等功能
近日,腾讯搜狗输入法发布全新版本,升级了AI帮写、AI对话功能,同时推出快捷问答、AI宠物、AI自拍表情等多种新玩法。本次腾讯搜狗输入法对AI帮写模块进行了全面升级,针对社交、创作、评论评价、职场四个方向上线了21个帮写指令,覆盖日常聊天、种草笔记、撰写评论等130多种使用场景,可根据用户关键词进行优化、改进和丰富信息,提高文本的表达效果。
2024年7月1日·周一
马斯克:X AI 将于 8 月推出 Grok-2 大语言模型
北京时间今日午间,马斯克在自己的 X(推特)平台上发文宣布,其人工智能初创公司 xAI 的大语言模型 Grok-2 将于 8 月推出。xAI 今年 3 月、4 月陆续推出了 Grok-1.5 大语言模型和首个多模态模型 Grok-1.5 Vision。xAI 曾表示,Grok-1.5V 在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域“都能媲美现有的前沿多模态模型”。
微软 AI CEO:今年年底,我们将拥有实时的语音界面,允许完全动态的交互
在近日阿斯彭思想节上,微软 AI 负责人Mustafa Suleyman与著名财经记者Andrew Ross Sorkin进行了一场深入对话。Suleyman 强调, AI 的发展并不会像加密货币那样成为一时的热潮,而是会持续对社会产生深远影响。他指出,当前的 AI 技术已经在多个领域展现了其价值,这与加密货币在短时间内的表现形成鲜明对比。在谈及中美技术竞争时,Suleyman 呼吁在保持竞争的同时,也应寻求合作的机会。他指出,尽管中美之间存在技术上的分裂,但全球化背景下的合作仍然是不可忽视的趋势。通过共同努力,双方可以在各自的技术生态系统中找到共存的方式。
谷歌 AI 视频编辑应用 Google Vids 上线测试
谷歌曾在今年 4 月发布了一款全新的 AI 视频编辑应用 Google Vids ,并宣布预计 6 月登陆 Google Workspace Labs 测试版。据 Android Authority 报道,目前该应用已经于上周五前后悄悄上线并开启测试,功能齐全。
扎克伯格最新深度访谈讨论智能眼镜、神经腕带与个性化AI的未来
近日, Meta CEO Mark Zuckerberg 与科技创作者 Robin Kallaway 进行了一场深度对话,讨论了未来十年的技术发展,尤其是智能眼镜、神经腕带和 AI 技术在创作者和小企业中的应用。Zuckerberg 详细讨论了智能眼镜的未来发展方向,认为其将逐步取代手机成为主要的个人硬件设备。他提到,未来的智能眼镜将分为三种类型:无显示屏的基础型、带有抬头显示的中级型和全息显示的高级型。他还强调,未来的 AI 技术将不会是单一的,而是多样化的,允许创作者和小企业创建定制化的 AI。这种多样化的 AI 体验将提升用户互动的丰富性和个性化。
2024年6月30日·周日
微软 Copilot for Microsoft 365 下月将迎新功能,设计、写作全面赋能
微软近期公布了其备受关注的智能协助手 Copilot for Microsoft 365 的一系列即将于 7 月上线的新功能,进一步加强了该服务在微软旗下众多软件产品中的整合力度。备受期待的一项更新是将微软的人工智能艺术创作工具“设计器(Designer)”引入 Word 和 PowerPoint 应用。用户只需打开 Copilot 并通过文字指令描述需求,Copilot 就能自动生成图像。
SK海力士计划到2028年投资103万亿韩元,用于AI和芯片领域
韩国SK海力士母公司SK集团表示,到2028年,SK海力士将投资103万亿韩元(746亿美元),以加强其芯片业务,专注于人工智能。SK集团还表示,计划到2026年确保80万亿韩元的资金,用于投资人工智能和半导体领域,以及为股东回报提供资金,并对超过175家的子公司进行精简。
知乎发布全新AI产品“知乎直答”,周源:用提问发现世界
6月29日,知乎一年一度的行业先锋盛典——第十届盐Club新知青年大会在北京751园区开幕,知乎创始人、董事长兼CEO周源在大会发表演讲,重磅发布知乎最新的AI搜索产品“ 知乎直答 ”,通过大模型应用创新,为用户和创作者带来全新的生产力工具,探索提问的全新形态,帮助每个人更好地“用提问发现世界”。
亚马逊聘请Adept创始人,加码布局AGI研发
周五(6月28日),负责亚马逊通用人工智能(AGI)部门的高级副总裁兼首席科学家Rohit Prasad在给员工的一份备忘录中写道,“亚马逊聘请了Adept联合创始人兼首席执行官David Luan和其他几位才华横溢的团队成员加入我们的AGI团队”。Adept凭借其技术赢得了包括英伟达、Atlassian、Workday和Greylock在内的许多支持者,筹集了超过4.15亿美元的资金,估值曾一度达到了10亿美元左右。
2024年6月29日·周六
OpenAI CEO 奥特曼:AGI 或在十年内实现全球 GDP 翻倍
近日,OpenAI CEO Sam Altman 和 Airbnb CEO Brian Chesky 与 NBC 主持人 Lester Holt 展开了一场关于 AI 发展现状、未来前景以及其对社会潜在影响的讨论。Sam Altman 与 Brian Chesky 都强调, AI 的发展并非一蹴而就,而是一个渐进的过程。尽管 ChatGPT 的推出引起了广泛关注,但大多数应用程序还未发生根本性变化。未来几年,随着更多应用程序在 AI 模型基础上构建,变化将更加显著。Altman 预测, AGI 可能会使全球 GDP 翻倍,这将成为巨大的生产力驱动因素。他相信,随着人们逐渐采用这些工具, AI 将带来前所未有的经济和社会效益。
文心一言4.0 Turbo发布,总用户量突破3亿
文心一言4.0发布254天后,百度日前正式发布了一款新模型文心一言4.0 Turbo。百度CTO王海峰介绍称,新模型已正式在网页以收费形式向用户开放,并同期通过千帆大模型平台对开发者开放API。根据官网披露的数据,文心一言4.0 Turbo进一步强化检索能力,上下文输入的长度从4.0版的2K tokens升级到了128K tokens,可同时阅读100个文件/网址,AI生图的分辨率也从512×512升级至1024×1024。
智源张宏江:AI系统永远不应该欺骗人类
美国国家工程院外籍院士、北京智源研究院的创始人和首任理事长、智源研究院学术顾问委员会主任张宏江近日在接受英国《金融时报》采访时,他谈到国际合作在 AI 保障方面的重要性,以及中国 AI 技术面临的机遇和挑战。他表示:“人工智能系统永远不应该自我复制和改进。这条红线非常重要。当系统有能力自我复制、自我改进时,它就会失控。第二是欺骗。人工智能系统不应该具有欺骗人类的能力。”
微软与 OpenAI 价值 130 亿美元的协议面临欧盟的额外审查
微软公司对OpenAI公司的130亿美元投资将受到欧盟反垄断监管机构的进一步审查,欧盟反垄断监管机构准备就OpenAI公司独家使用微软云技术一事对其竞争对手进行调查。预计欧盟反垄断专员Margrethe Vestager周五将排除根据欧盟合并规则展开调查的可能性,而是宣布,监管机构将更多地询问微软的竞争对手和客户,了解微软与OpenAI签订的排他性条款,以及这些条款是否可能对竞争产生负面影响。
Rain AI 招募苹果芯片专家,加速AI芯片研发
美国芯片初创公司Rain AI周五发布公告称,公司挖来曾在苹果效力17年的芯片高管Jean Didier Allegrucci。他将担任公司的硬件工程主管,领导下一代突破性节能芯片的开发。三周前,Rain AI刚挖来Meta ASIC架构团队的首席架构师Amin Firoozshahian。
2024年6月28日·周五
Meta发布LLM编译器,称将改变我们的编程方式
Meta发布了Meta 大型语言模型(LLM)编译器,这是一套强大的开源模型,旨在优化代码并彻底改变编译器设计。这项创新有望改变开发人员优化代码的方式,使代码优化更快、更高效、更具成本效益。
科大讯飞发布星火智能批阅机:基于星火大模型,准确率 99%
科大讯飞昨日举办讯飞星火 V4.0 发布会,发布了讯飞星火大模型 V4.0,同时升级了星火教育大模型。通过自动化识别,星火智能批阅机试题解析的准确率大于 99%,学生可以随便涂抹,自由排版不限格式。原来 90 分钟的作业批改时间可以变成 5 分钟,60 分钟的学情统计时间缩减至 1 分钟。
OpenAI AI模型销量超越微软,年化收入达10亿美元
在2019年与微软建立合作伙伴关系后,AI初创公司OpenAI显示出了惊人的销售能力,根据最新两家公司内部数据,截至3月,OpenAI通过出售对其AI模型的访问权限,产生了约10亿美元的年化收入。相比之下,微软的同类产品Azure OpenAI Service,直到最近才达到了10亿美元的年化收入(ARR)。
OpenAI 与《时代》杂志达成合作协议,将用其内容训练
ChatGPT 当地时间周四,《时代》杂志与OpenAI宣布,两家公司达成了一项多年内容授权协议和战略合作伙伴关系。该协议允许OpenAI将这家出版商的内容引入ChatGPT,并帮助训练其最先进的人工智能(AI)模型。据新闻稿介绍,OpenAI可以通过这笔交易访问《时代》过去100多年的档案和文章,以训练其AI模型,并在其面向消费者的产品(如ChatGPT)中用于回复用户的询问。
Hugging Face CEO:阿里Qwen-2成全球开源大模型排行榜第一,中国处于领导地位
6月27日凌晨,全球知名开源平台Hugging Face的CEO在社交平台宣布,阿里最新开源的Qwen2-72B指令微调版本,成为开源模型排行榜第一名。他表示,为了提供全新的开源大模型排行榜,使用了300块H100对目前全球100多个主流开源大模型,例如, Qwen2 、Llama-3、mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全新评估。结果显示,阿里开源的Qwen-2 72B力压科技、社交巨头Meta的Llama-3、法国创企Mistral AI的Mixtral成为新的王者,中国在全球开源大模型领域处于领导地位。
Omdia:预计2024年生成式AI软件市场将增长124%
Omdia最新发布的《人工智能软件市场预测》显示,生成式人工智能(GenAI)软件收入将从 2023 年开始以 53% 的复合年增长率增长,到 2028 年达到 580 亿美元。2024 年 GenAI 软件收入将增长 124%,比之前预测的 100%有所上调。
百度官方数据:近八成高考生使用百度AI志愿助手
近日,全国超1300万考生陆续进入高考填报志愿环节。据百度官方发布的数据,仅6月25日一天,就有超过1000万用户使用了百度AI志愿助手,辅助填报志愿。也就是说,近八成的考生使用了AI志愿填报服务。
Google翻译新增110种语言支持,代表着6.14亿语言使用者
Google今天表示,它的翻译服务将增加对 110 种语言的支持。该公司利用其 PaLM 2 人工智能模型为翻译提供支持。这些语言包括阿法尔语、粤语、曼克斯语、尼科语、旁遮普语(Shahmukhi)、塔马齐特语(阿马齐格语)和托克皮辛语。该公司表示,这些新增语言的使用者超过 6.14 亿,约占总人口的 8%。
科大讯飞发布讯飞星火大模型 V4.0,称整体超越 GPT-4 Turbo
在讯飞星火 V4.0 发布会上,科大讯飞发布了讯飞星火大模型 V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。在国内外中英文 12 项主流测试集中,星火 V4.0 在 8 个测试集中排名第一,领先国内大模型,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现对 GPT-4 Turbo 的整体超越。
谢赛宁 Yann LeCun 团队发布开源多模态大模型 Cambrian-1
纽约大学谢赛宁和 Yann LeCun 团队最新开发了 Cambrian-1 多模态大模型,Cambrian-1 是一个完全开放的项目,专注于视觉表征学习,并探索多模态大型语言模型(MLLM)的视觉中心能力。该项目旨在将研究焦点从扩大语言模型规模转移到增强视觉表征上,以促进多模态理解的稳健性。
亳州市与华为公司合作打造华佗中医药大模型
亳州市和华为公司合作正在建设华佗中医药大模型,合作将充分利用华为算力、算法优势,亳州中医药政策、区域、资源、数据优势,打造首个中医药产业大模型——华佗中医药大模型。
软银将以30亿美元的估值投资AI搜索初创公司Perplexity
软银集团旗下愿景基金2期于6月27日宣布投资美国人工智能初创公司PerplexityAI,计划投资1000万至2000万美元。PerplexityAI旨在利用AI技术挑战谷歌搜索,此次融资总额达2.5亿美元,使其估值显著增长,成为业内高估值公司之一。这标志着软银在AI领域的进一步扩展,为PerplexityAI提供资金支持,助力其在搜索引擎市场的发展。
Anthropic 为 Claude 聊天机器人推出 Projects 团队知识库协作功能
Anthropic 旗下的 AI 聊天机器人 Claude 现在允许用户将聊天组织成 Projects 项目,集中管理知识集合和聊天活动,可帮助团队成员共享最佳聊天记录,促进创意生成、战略决策和卓越成果。Porjects 功能使用户可以将Claude的输出与内部知识结合,例如风格指南、代码库、访谈记录或过去的工作,从而提供专业协助。用户可以为每个项目定义自定义指令,以进一步定制Claude的响应。
2024年6月27日·周四
B站CEO陈睿:每月超过8000万用户在平台看AI内容
6月26日晚间,哔哩哔哩(以下简称“B站”)举办15周年庆,B站董事长兼CEO陈睿发表演讲,公布了AI在B站上的内容消费趋势。2023年,B站AI相关内容的日均视频播放量同比增长超过80%,每个月有超过8000万用户在B站看AI,AI相关内容消费人群中有60%为00后。
在线设计协作平台 Figma 推出系列原生 AI 设计功能
在线设计协作平台 Figma 在其设计工具中引入了原生 AI 功能 Figma AI ,以加速工作流程并使团队能够构建高质量的软件。Figma AI 现已作为有限测试版的一部分推出,支持使用单个提示生成设计草稿,帮助设计师探索不同的视角来表达愿景,实现快速原型设计和迭代等。
黄仁勋:AI新一轮浪潮预计将使价值50万亿美元的重工业实现自动化
据国外媒体报道,美国当地时间周三(北京时间周四凌晨),英伟达召开2024年股东大会。本次股东大会批准了包括黄仁勋在内的12位董事提名,通过了高管薪酬方案;普华永道继续担任独立注册会计师事务所。黄仁勋2024财年薪酬增长60%,达3400万美元。黄仁勋薪酬涨幅与英伟达业绩紧密相关。黄仁勋表示,人工智能的新一轮浪潮预计将使价值50万亿美元的重工业实现自动化。
Stability AI 获前 Facebook 总裁主导的 8000 万美元投资,并豁免 4 亿美元的债务
由前 Facebook 总裁 Sean Parker 领衔的投资者群体承诺向 Stability AI 投资 8000 万美元,以接管这家在商业与运营受阻的 AI 独角兽。据悉,新一轮投资的投资者包括 Greycroft、O’Shaughnessy Ventures 和生物技术投资者 Robert Nelsen,老股东Coatue、Lightspeed 以及 Ashton Kutcher 的Sound Ventures 也承诺投资。此外,包括前 Google CEO Eric Schmidt 以及伦敦 Stability AI 早期支持者在内的投资者群体已经与供应商达成协议,豁免 Stability AI 欠下的 1 亿美元债务,同时免除公司未来 3 亿美元的义务,这些债务主要用于云计算服务提供商。
AI“早筛”癌症最新研究:准确区分13种癌症,准确率98.2%
日前,来自伦敦帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET,通过观察 DNA 甲基化模式,从非癌组织中识别出 13 种不同类型的癌症(包括乳腺癌、肝癌、肺癌和前列腺癌等),准确率高达 98.2%。相关论文已发表在 Biology Methods and Protocols 上。据论文描述,该模型依赖于组织样本(而不是血液中的 DNA 片段),目前还处于实验阶段,需要对更多样化的活检样本进行额外的训练和测试,方可进一步用于临床。
首部由 Sora 制作的商业片《玩具反斗城的起源》亮相
Sora新大片又又又火了,还是个正经的商业宣传片。影片名为《玩具反斗城的起源》,由导演Nik Kleverov使用OpenAI的Sora制作。消息发布后,相关帖子瞬间引起近300万网友围观。这部商业片主要讲述了吉祥物长颈鹿杰弗瑞的起源故事以及创始人Charles Lazarus如何梦想出玩具反斗城。Sora在影片中仅用几个自然衔接的镜头,就传达了品牌方的一些关键元素。比如作为玩具商,影片整体呈现了儿童梦幻色彩。
荣耀发布手机行业首个端侧 AI 反诈检测技术,可向用户发出风险提醒
在上海世界移动通信大会(2024MWC 上海)期间,荣耀终端发布了手机行业首个端侧 AI 反诈检测技术。据荣耀 CEO 赵明介绍,该技术能够自主识别用户视频通话中的画面要素。若检测到视频中存在 AI 换脸,将会向用户发出风险提醒。
爆料称苹果 A18 处理器 NPU 性能比 M4 芯片更强
据媒体报道,有爆料称苹果iPhone 16系列将搭载的A18系列处理器,在NPU性能上有望超越苹果自家的M4处理器。据了解,上一代A17 Pro处理器的NPU拥有16核心,性能达到35TOPS。今年5月,苹果发布的11英寸和13英寸iPad Pro搭载了M4处理器,该处理器基于台积电第二代3nm工艺,拥有280亿个晶体管,NPU算力从18TOPS提升到了38TOPS。
2024年6月26日·周三
钉钉将对所有 AI 大模型厂商开放,首批 7 家接入
在今日的 MAKE 2024 钉钉生态大会上,钉钉总裁叶军宣布,钉钉将对所有大模型厂商开放,构建“国内最开放 AI 生态”。其中,MiniMax、月之暗面、智谱 AI、猎户星空、零一万物和百川智能,六家千亿级大模型厂商已宣布接入钉钉,成为继通义千问后首批接入钉钉的大模型。未来,用户可在钉钉上直接使用通义等七家大模型产品。
ElevenLabs 推出 iOS 版 AI 文本转语音应用
ElevenLabs Reader App AI语音初创公司 ElevenLabs 推出一款文本转语音应用 ElevenLabs Reader App ,利用AI将各类文本内容,如文章、PDF文件、ePub等,转化为自然流畅、高音质的语音。该应用目前对iOS用户免费下载和使用三个月(Android版待上线),初期支持英语,计划未来扩展至29种以上语言(中文版iOS预计于7月11日推出)。
老板电器推出首个烹饪大模型“食神”大模型
国产厨电龙头老板电器最新发布号称全球首个的烹饪行业大模型——“食神”大模型。基于数十亿级行业数据,数千万级知识图谱加持,能为每个人提供个性化量身定制的解决方案,不仅告诉用户怎么做菜,还能调动所有设备,协助你把菜做出来。预计于10月开启内测,然后12月正式上线。
OpenAI 与美国制药巨头礼来达成合作,利用生成式 AI 开发新型抗菌药物
当地时间 25 日,美国制药巨头礼来公司宣布与 OpenAI 达成合作,将利用后者生成式 AI 技术来开发新型抗菌药物,用于治疗耐药性病原体。OpenAI 首席运营官 Brad Lightcap 表示,先进的 AI 技术有望为制药行业带来“创新突破”。礼来公司首席信息与数字官 Diogo Lau 则表示,生成式 AI 为加速发现新型抗菌剂和开发定制化、专门技术以对抗耐药性病原体开辟了新的机遇。
OpenAI 推迟发布 ChatGPT 语音助手功能,拟秋季向付费用户全面推出
OpenAI已宣布推迟发布备受期待的ChatGPT语音助手功能,以确保它能够安全有效地处理来自数百万用户的请求。这家人工智能初创公司在5月份的产品发布会上为GPT-4o推出了语音选项,GPT-4o是GPT-4模型的更新版本,在实时处理文本、音频和图像方面做得更好。周二,OpenAI还表示,该公司计划在秋季向所有付费用户推出语音功能,同时其也在努力发布视频和屏幕共享功能。
OpenAI 的 ChatGPT Mac 版应用已向所有用户开放,支持语音对话
OpenAI 公司宣布,其首款适用于 Mac 的 ChatGPT 聊天机器人应用正式面向所有用户开放下载。此前一个月,该应用一直处于测试阶段,仅 Plus 付费订阅用户可以使用。OpenAI 称,ChatGPT 的 Mac 应用旨在与用户日常操作无缝集成,其原生支持 Mac 系统,并提供方便的快捷键 (Command + 空格键) 允许用户随时随地启动应用。
消息称亚马逊秘密研发AI聊天机器人“Metis”
据 Business Insider 报道,科技巨头亚马逊正在秘密研发一款人工智能聊天机器人,代号为“Metis”,目标直指 OpenAI 旗下的知名产品 ChatGPT。内部文件显示,Metis 能够以一种智能对话的方式回答文本和图像相关的问题,并提供相应的信息来源链接,推荐后续查询,甚至生成图像。
2024年6月25日·周二
曝AI独角兽阶跃星辰正进行新一轮融资,估值20亿美元
阶跃星辰,总部位于上海的AI大模型公司,微软前全球副总裁姜大昕创办,在自研大模型、应用产品先后亮相后,正在获得更大的认可,垒起更大的雪球。据量子位报道,阶跃星辰正在进行一轮估值20亿美元的新融资,阿里巴巴再次出现在布局传闻中。阶跃星辰至今公开的toC产品共两款,一款叫 跃问 ,聊天类应用,定位个人效率助手。另一款叫 冒泡鸭 ,是AI开放世界平台,提供海量智能体,主打一个休闲娱乐。
消息称谷歌将推出明星网红 AI 聊天机器人,与 Meta 竞争
根据 The Information 爆料消息,谷歌正在基于明星和 YouTube 网红构建新的 AI 聊天机器人。爆料称,谷歌的明星网红 AI 聊天机器人将由该公司的 Gemini 大语言模型提供支持。
OpenAI 收购屏幕共享华人远程协作公司 Multi
6 月 24 日,继收购 Rockset 后,OpenAI 又收购了一家远程协作公司 —— Multi,是近期 OpenAI 大举投资企业解决方案的战略之一。Multi 提供的功能包括满足最多 10 人通过屏幕共享进行协作、自定义快捷方式以及代码、设计以及文档的自动链接。此前,Multi 已经从 Greylock 以及 First Round Capital 等风投公司筹集近 1300 万美元。交易完成后,Multi 团队的 5 名成员将加入 OpenAI。
OpenAI 将开始阻止来自非支持国家和地区的 API 流量
今日,全球知名的人工智能公司OpenAI宣布,为了维护服务质量和安全性,将采取额外措施来限制来自当前不支持的国家和地区的API流量。据官方推送的邮件通知中明确指出,自7月9日起,OpenAI将开始阻止来自非支持国家和地区的API流量。受影响组织若希望继续使用OpenAI的服务,必须在其支持的国家或地区内访问。
消息称因隐私问题,苹果拒绝与 Meta 合作将其 AI 聊天机器人带入 iOS 18
据彭博社报道,苹果公司因隐私问题拒绝了与 Facebook 母公司 Meta 的人工智能合作。今年 3 月,Meta 和苹果曾就可能的合作进行过简短讨论,但谈判没有取得进展,苹果也不计划将 Meta 的大型语言模型 (LLM) 集成到 iOS 系统中。
全球三大唱片公司起诉AI音乐生成公司Udio和Suno
当地时间周一,全球三大唱片公司环球音乐、索尼音乐、华纳音乐起诉了人工智能(AI)音乐技术公司Udio和Suno,称它们利用唱片公司的内容来训练生成音乐的AI系统,大规模侵犯了版权。唱片公司指出,这些AI公司在没有获得明确授权的情况下就复制音乐,以训练它们的AI系统进行创作,这些音乐作品可能会在市场上与人类艺术家的作品形成竞争,降低艺术作品的价值,最终将其(人类艺术家的作品)淹没。
2024年6月24日·周一
字节跳动联合博通开发专用芯片?官方回应:消息不实
6月24日,有消息称字节跳动为削减采购成本并确保高端 AI芯片供应稳定,与美国博通(Broadcom)合作开发先进AI处理器。针对该消息,字节跳动方面对第一财经记者回应称:消息不实。
商汤大模型AI办公助手「办公小浣熊」上线微信小程序版
基于商汤“日日新SenseNova”大模型能力开发、广受好评的数据分析产品「 办公小浣熊 」今天正式上线“小程序版”——Raccoon智能助手。既拥有网页版的完整功能,又专为移动办公定制专属技能。微信小程序搜索 “Raccoon智能助手”,你可以在小程序中,直接插入微信聊天中的文件(xls/xlsx/csv/txt/json等)。简单几句对话,就能提炼重点、生成各类图表。还能以缜密的逻辑推理能力,给出更多建议。
阿里云通义灵码 AI 编程助手上线微软 Visual Studio 插件市场
通义灵码 是阿里云出品的一款基于通义大模型的智能编码辅助工具,支持 Java、Python、Go、C++ 等 200 多种编程语言。通义灵码 6 月 20 日宣布上线了微软 Visual Studio 插件市场,该工具此前已上线了 Visual Studio Code、JetBrains IDEs 等主流编程工具,全渠道下载量超 350 万。
多模态大模型初创公司「智子引擎」完成千万级Pre-A轮融资
近日,南京智子引擎信息科技有限公司(以下简称“智子引擎”)完成千万级Pre-A轮融资,本轮融资由徐汇资本独家投资完成。智子引擎成立于2021年5月,团队从2018年就开始跟进大模型,是国内较早对多模态大模型展开研究的团队。智子引擎创始人、CEO高一钊是中国人民大学高瓴人工智能学院博士,师从卢志武教授。
报道称字节跳动与博通合作开发5nm AI芯片
据报道,字节跳动为削减采购成本并确保高端 AI芯片供应稳定,正与美国博通(Broadcom)合作开发先进 AI 处理器。消息指,该处理器为5nm ASIC(专用集成电路),预计会符合美国出口管制新规,制造工作将外包给台积电。消息人士称,虽然目前芯片设计工作正顺利进行中,但仍未进入“流片”(试生产)阶段,预计台积电今年不会生产这款芯片。目前,字节跳动和博通尚未回应置评请求。台积电拒绝置评。
英伟达GB200供不应求,追单日月光、京元电等台链封测厂
英伟达(NVIDIA)以全新Blackwell架构打造的GB200与B系列人工智能(AI)芯片获得客户大量导入,呈现供不应求盛况,英伟达先前大举追加台积电先进制程投片量后,追单效应蔓延至后段封测厂,日月光投控、京元电运营大爆发,第四季相关订单量季增幅度高达一倍。
阿里和华东师大推出AI合成视频后调优技术ExVideo,可生成128帧视频
阿里巴巴和华东师大的研究人员推出了一种视频合成模型的后调优技术 ExVideo ,能够扩展现有视频合成模型的时间尺度,以生成更长和帧数更多的视频。该团队基于Stable Video Diffusion模型,训练了一个能够生成长达128帧连贯视频的扩展模型,同时保留了原始模型的生成能力。
阿里与华东师大推出AI将视频转卡通风格的框架Diffutoon
阿里巴巴和华东师大的研究人员近日推出了一个利用AI技术将视频转换为卡通动漫风格的框架 Diffutoon ,基于扩散模型的可编辑卡通着色技术,能够将真实感视频转换成动漫风格。Diffutoon能够渲染细节丰富、高分辨率、长时间视频,并可通过附加分支根据提示编辑内容。
《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源
近期,机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》,旨在讲解从头开始构建大型语言模型的整个过程,包括如何创建、训练和调整大型语言模型。最近,Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。
研究发现 GPT-4o 的道德推理能力已比专家更强
最新研究显示,人工智能在道德推理方面的能力可能已经超越了人类专家。美国北卡罗莱纳大学教堂山分校和艾伦AI研究所的研究人员开展的两项研究中,OpenAI的新型聊天机器人GPT-4o在提供道德建议方面,被认为质量优于公认的道德专家。
消息称苹果与 Meta 讨论合作,将生成式 AI 引入 Apple Intelligence
据“华尔街日报”报道,苹果和 Meta Platforms 讨论了人工智能方面的合作。据知情人士透露,Facebook 的母公司 Meta 已与苹果公司讨论,将 Meta 的生成式人工智能模型整合到最近发布的 Apple Intelligence 中,用于 iPhone 和其他设备。报道称,除了谷歌和 Meta,人工智能初创公司 Anthropic 和 Perplexity 也一直在与苹果商谈,希望把它们的生成式人工智能引入苹果智能系统。
2024年6月23日·周日
月之暗面回应进军美国市场:目前没有开发和发布任何海外产品的计划
外媒 The Information 报道称,月之暗面正在为进军美国市场做准备。一名员工和另一名知情人士透露,“公司员工一直在开发针对美国市场推出的产品,包括一款可在苹果和谷歌移动应用商店中下载的 AI 角色扮演聊天应用程序 Ohai 和一款音乐视频生成器 Noisee 。”对此,月之暗面今日回应新浪科技表示,“我们目前没有开发和发布任何海外产品的计划。”
美国财政部公布新规草案,将禁止美国人对中国 AI、芯片等领域的某些投资
据报道,今天凌晨,拜登政府下属的美国财政部发布一份长达12页的规则草案,要求对美国在半导体和微电子、量子计算和人工智能领域的某些投资进行监管,禁止或要求限制中国在 AI 和其他技术领域的投资。美国财政部表示,新规旨在实施“一项狭义的、有针对性的国家安全计划”,重点关注对受关注国家的某些境外投资。
消息称 Stability AI 获超 1 亿美元投资并任命新的 CEO
外媒 The Information 援引参与决定的人士报道,英国人工智能初创公司 Stability AI 已任命 Prem Akkaraju 为新任首席执行官。视觉特效公司维塔 Wētā FX 前首席执行官 Prem Akkaraju 是包括前 Facebook 总裁 Sean Parker 在内的投资者中的一员。报道称,这些投资者总共出资超过 1 亿美元(IT之家备注:当前约 7.28 亿元人民币),新的资金可能会缩减一些现有投资者的股份。目前,Stability AI 公司拒绝发表评论。
2024年6月22日·周六
OpenAI宣布收购云原生数据库公司Rockset,后者估值最高36亿
OpenAI公司在社交平台上宣布,其收购了领先实时分析数据库公司Rockset,但OpenAI没有透露交易金额。OpenAI强调,基于Rockset提供的世界一流的数据索引和查询功能,OpenAI将在其产品中整合Rockset技术,使公司能够将其数据转化为可操作的情报。截至去年8月29日,Rockset公司共获得的融资总额在1亿美金左右,投后估值1亿-5亿美元。
亚马逊据悉将推出AI版Alexa,每月收费5到10美元
据知情人士透露,亚马逊正计划对其亏损十年之久的语音助手Alexa服务进行重大改造,将AI聊天机器人纳入其中,并提供两个级别的服务,每月收取5到10美元的费用。这将是Alexa自2014年推出以来的首次重大改革,新的语音助手将称为“Remarkable Alexa”。一些参与该项目的亚马逊员工说,这是亚马逊重振Alexa服务的最后尝试,亚马逊已经要求员工在8月的最后期限前准备好最新版本的Alexa。
腾讯混元文生图大模型开源训练代码,发布LoRA与ControlNet插件
日前,腾讯混元文生图大模型(以下简称为 混元DiT模型 )宣布全面开源训练代码,同时对外开源混元DiT LoRA 小规模数据集训练方案与可控制插件ControlNet。作为中文原生模型,用户在通过混元DiT的训练代码进行精调时,可以直接使用中文的数据与标签,无需再将数据翻译成英文。
华为云盘古大模型 5.0 发布:升级多模态能力,提供十亿到万亿级不同参数
在昨日举行的华为 HDC 2024 开发者大会上,华为常务董事、华为云 CEO 张平安宣布盘古大模型 5.0 正式发布,在全系列、多模态、强思维三个方面实现升级。全系列方面,盘古大模型 5.0 包括十亿级、百亿级、千亿级、万亿级等不同参数规模,提供盘古自然语言大模型、多模态大模型、视觉大模型、预测大模型、科学计算大模型等。
腾讯AI Lab联合腾讯TME天琴实验室推出AI音乐创作模型「琴乐大模型」
腾讯音乐娱乐集团(TME)天琴实验室和腾讯 AI Lab 联合研发 AI 音乐大模型「 琴乐大模型 」,具备丰富的 AI 作曲和编曲能力。只需输入中英文关键词、描述性语句或音频,「琴乐大模型」就可直接生成音乐,也可为有后期编辑需求的音乐人,提供生成乐谱的能力。
OpenAI首席技术官:预计几年内“博士级智能”的AI就会出现
OpenAI首席技术官米拉·穆拉蒂(Mira Murati)预测了人工智能能力的快速发展,预计在未来“几年”里,用于特定任务的“博士级智能”就会出现。在达特茅斯工程学院主持的一场对话中,作为该校校友的穆拉蒂讨论了ChatGPT和DALL-E背后的人工智能,以及正在进行的安全和道德考虑。
2024年6月21日·周五
快手AI视频生成工具「可灵」推出全新功能图生视频和视频续写
据可灵官方消息, 可灵 今天宣布两个新功能现已上线,分别是图生视频和视频续写。其中图生视频功能可以根据用户提供的图片生成一段5秒的视频,用户还可以提供提示词来控制视频的运动轨迹。而视频续写功能可以让可灵为生成的视频添加后续,每次可灵可以增加4-5秒的视频时长。该功能支持多次续写,最长可生成长达3分钟的视频。用户还可以根据提示词来对续写内容进行规定。
软银集团创始人孙正义:将打造超级人工智能,能力比人类强1万倍
在本周四的股东大会上,软银集团创始人孙正义宣称,他已经准备好对人工智能孤注一掷,“无论输赢”。而本周五,孙正义更进一步放出豪言壮语:软银此前所做的一切都是为了实现AI梦想的热身,他的目标是要打造出“超级人工智能”。他预言,超级人工智能可能会在10年内出现,其能力将会是人类的1万倍。
阿里云推出首个 AI 程序员,具备架构师、开发 / 测试工程师等岗位技能
在今天的阿里云上海 AI 峰会上,阿里云推出首个“AI 程序员”,具备架构师、开发工程师、测试工程师等岗位技能,能完成任务分解、代码编写、测试、问题修复、代码提交整个过程,号称最快“分钟级”完成应用开发。据介绍,该“AI 程序员”是基于通义大模型构建的多智能体,包含任务分解、编码、测试等不同板块,与“通义灵码”有所不同。
金沙江创投朱啸虎:5年后将没有独立大模型公司存在
在今日的2024创投十年高峰论坛上,金沙江创投合伙人朱啸虎发表主题演讲。他表示,今年将是AIGC创业回归商业本质的开始。5年后将没有独立的大模型公司存在。因为没有商业模式,价格已经在成本以下了,创业公司没办法跟进。朱啸虎还提到,生成式AI是一个类似于PC、移动互联网的十年周期,将是未来10年的长坡厚雪。他判断,2024将是大模型争霸之年。
AI 视频公司 HeyGen 完成 6000 万美元 A 轮融资,估值超 5 亿美元
AI 视频公司 HeyGen 宣布,已经完成了 6000 万美金 A 轮融资,由 Benchmark 领投。跟投方则包括了 Thrive Capital、BOND、Conviction、Dylan Field、Elad Gil、Aviv Nevo、Neil Mehta 和 SV Angel 等。此次融资后估值超过了 5 亿美金,这和之前传出的信息差不多,并且 ARR 在 1 年多时间就从 100 万美金达到了 3500 万美金,公司自 2023 年第二季度以来一直盈利。
Anthropic 发布全新大模型 Claude 3.5 Sonnet
Anthropic 发布了全新大模型 Claude 3.5 Sonnet,号称是迄今为止最智能的模型。据介绍,Claude 3.5 Sonnet 是 Anthropic 即将推出的 Claude 3.5 系列的首个版本。该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强 Claude 3 Opus。与此同时,运行速度、成本与自家前代 Claude 3 Sonnet 相当。目前,Claude 3.5 Sonnet 已经在 Claude.ai 和 Claude iOS 应用程序上免费提供,而 Claude Pro 和 Team 计划订户能够以更高的速率访问它。
数据显示谷歌已降低 Reddit 对 AI 搜索结果的影响
根据搜索引擎优化平台 SERanking 当地时间 20 日公布的数据显示,Reddit 已经不再是谷歌“AI 摘要”功能信息来源的前十名。此前,谷歌的AI摘要功能上线后不久,不少用户反馈称 AI 会生成一些奇怪的结果,例如往披萨里加胶水防止配料掉落、每天吃几块小石头等等。据悉,部分奇怪回复是 AI 系统从 Reddit 帖子中提取信息而造成的,例如往披萨里加胶水就来自一个 11 年前的 Reddit 帖子。
AI 客户支持初创公司 Decagon 获 3500 万美元融资
6月18日,又一家生成式 AI 初创公司 Decagon 浮出水面,正式宣布完成由 Accel 领投的 3500 万美元 A 轮融资以及此前由 a16z 领投的 500 万美元种子轮融资。此外,此次融资还吸引了A*、Elad Gil 和多位知名天使投资人的参与,包括 Box 的 CEO Aaron Levie、Airtable的 CEO Howie Liu等。Decagon 由 CEO Jesse Zhang 以及 CTO Ashwin Sreenivas 共同创立,致力于为企业提供先进的生成式 AI 平台,以解决复杂的客户支持问题。
AI 新研究可用手机检测中风:准确率达 82%,分析面部肌肉运动
来自皇家墨尔本大学(RMIT)生物医学工程师团和圣保罗州立大学的博士生 Guilherme Camargo de Oliveira 共同开发了一款基于 AI 的面部筛查工具,医护人员只需要借助智能手机,在几秒钟内就可以确定患者是否中风。该工具在检测中风方面的准确率达到了 82%,但不会取代中风的综合临床诊断测试,仅用于帮助更快地识别需要治疗的人。
报道:台积电探索新AI芯片封装技术,允许单个晶圆放置更多组芯片
据《日经亚洲》报道,近日,台积电正在探索一种全新的先进芯片封装方法,以应对人工智能带来的计算需求激增。知情人士透露,这一新方法的核心是使用510毫米乘515毫米的矩形基板,而不是当前使用的传统圆形晶圆。这种设计可以在每片基板上放置更多的芯片组,从而提高生产效率。矩形基板的有效面积比圆形晶圆大三倍多,边缘剩余的无效区域也更少。
月之暗面进军北美,推出AI虚拟陪伴和音乐视频生成工具
据The Information报道,月之暗面(Kimi智能助手背后的公司)一直在开发针对美国市场的产品,包括在苹果和谷歌应用商店上架的人工智能角色扮演聊天应用 Ohai ,以及音乐视频生成器 Noisee 的网站。Ohai和Noisee的网站显示,这两款产品都属于一家位于加州桑尼维尔的公司Tranquillitatis((Tranquillitatis是月球上一个盆地的名称)。
我国人工智能企业数量已超 4000 家,去年 AI 核心产业规模达 5784 亿元
世界智能产业博览会上发布的《中国新一代人工智能科技产业发展报告 2024》显示,我国人工智能企业数量已经超过四千家,人工智能已成为新一轮科技革命和产业变革的重要驱动力量和战略性技术。 数据显示,2023年我国人工智能核心产业规模达5784亿元,增速13.9%。我国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元。
2024年6月20日·周四
阿里通义Qwen2成斯坦福大模型榜单最强开源模型
6月20日消息,斯坦福大学的大模型测评榜单HELM MMLU发布最新结果,斯坦福大学基础模型研究中心主任Percy Liang发文表示,阿里通义千问 Qwen2 72B模型成为排名最高的开源大模型,性能超越Llama3-70B模型。
花旗:银行业被人工智能取代的岗位数量将超过其他任何行业
花旗表示,银行业被人工智能取代的工作岗位可能比其他任何行业都多,因为这项技术势将颠覆消费金融并提高员工的工作效率。该行周三在一份新报告中表示,整个银行业约有54%的工作岗位有较高的自动化潜力, 另外有12%的岗位可能因为人工智能技术而得到增强。
斯坦福发布HumanPlus人形机器人,基于宇树科技的平台
继会烹饪、洗锅等家务活的Mobile ALOHA机器人后,斯坦福大学付子鹏(音)等最近基于中国厂商宇树科技Unitree H1机器人平台开发了名为HumanPlus的“万能”人形机器人。HumanPlus身高1.75米,拥有33个自由度的活动能力。它可以通过模仿人类的动作来学习新技能,如弹钢琴、打拳击、打字等。
B站开源轻量级 Index-1.9B 系列模型,基于 2.8T 训练数据
B站昨日开源了轻量级 Index-1.9B 系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。据介绍,该模型在预训练阶段使用了 2.8T 规模的数据,中英比例为 4:5,代码占比 6%。目前,角色扮演模型内置了角色“三三”,用户也可以按需创建自己的角色。
OpenAI联合创始人Ilya Sutskever宣布成立一家安全超级智能公司
前OpenAI首席科学官、联合创始人Ilya Sutskever成立了一家名为Safe Superintelligence Inc.的合资企业,旨在在一个纯粹的研究机构内创建一个安全、强大的人工智能系统,该机构近期无意销售人工智能产品或服务。
月之暗面 Kimi 开放平台将启动 Context Caching 上下文缓存内测
月之暗面官宣 Kimi 开放平台 Context Caching 功能将启动内测,届时将支持长文本大模型,可实现上下文缓存功能。据介绍,Context Caching(上下文缓存)是由 Kimi 开放平台提供的一项高级功能,可通过缓存重复的 Tokens 内容,降低用户在请求相同内容时的成本。
首个AI高考全卷评测结果发布:最高分303,数学全不及格
在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。
“AI 教父”杰弗里・辛顿履新,担任绿色材料初创公司 CuspAI 董事会顾问
据《财富》杂志周二报道,“AI 教父”杰弗里・辛顿已经同意担任绿色材料初创公司 CuspAI 董事会顾问。他表示,“人类在未来十年将面临许多挑战。其中一些挑战将由 AI 引发,另一些则可以通过 AI 解决。”
Meta FAIR团队发布多款模型、研究和数据集
Meta FAIR(Fundamental AI Research)团队于昨日发布了多款模型、研究和数据集,包括Meta Chameleon:多模态模型,7B/34B;Multi-Token Prediction:多词预测模型;JASCO:文本生成音乐模型;AudioSeal:AI语音检测;PRISM:AI反馈数据集;“DIG In”:人文地理差异评估方法。
OpenAI与Color Health合作打造辅助筛查/治疗癌症的AI工具
OpenAI 公司宣布和 Color Health 合作,借助 AI 开发造福癌症患者的新方法。双方探索使用 GPT-4o 模型创建 AI 工具 Cancer Copilot,帮助医生根据患者数据(包括个人风险因素和家族史)制定筛查和治疗计划。
2024年6月19日·周三
AI巨头英伟达市值3.34万亿美金超过微软、苹果,成为全球第一
北京时间6月19日凌晨1点多,全球最大 AI 算力提供商、AI芯片巨头英伟达股价盘中涨3.5%,市值达到3.337(3.34)万亿美元,超越微软、苹果,成为全球市值最高的公司。这一里程碑事件标志着,英伟达在技术革新和市场扩张方面的卓越成就,以及 AI 时代对于华尔街的重要性。
中国气象局发布三个AI气象大模型系统:命名风清、风雷、风顺
中国气象局最新发布了三个AI气象大模型系统,分别是:“风清”、“风雷”、“风顺”。“风清”是人工智能全球中短期预报系统,“风雷”是人工智能临近预报系统,两个模型由中国气象局联合清华大学组建攻关团队构建。“风顺”是人工智能全球次季节—季节预测系统,由中国气象局联合复旦大学和上海科学智能研究院基于人工智能方法构建。
AI蛋白质设计平台「百奥几何」完成Pre-A轮融资
百奥几何已完成新一轮融资,本轮融资由将门创投领投,智谱AI、盛景嘉成跟投,老股东高榕创投持续追加投资。募集资金将主要用于加速生成式AI大模型在生物制造领域落地,以及推进自有产品的开发。百奥几何成立于2021年,专注开发生成式AI蛋白质设计平台,从而赋能生物制造领域。
谷歌DeepMind推出V2A技术,可为无声视频添加逼真音效
在人工智能领域,谷歌旗下的DeepMind公司再次取得突破性进展,推出了一款名为V2A(Video-to-Audio,视频到音频)的AI模型。该项技术能够将视频像素与文本提示相结合,为无声视频生成包含对话、音效和音乐的详细音频轨道。
国家药监局:AI 可用于说明书适老化改造、业务办理及政策咨询等场景
国家药监局今日印发《药品监管人工智能典型应用场景清单》(以下简称清单),旨在推动人工智能技术在药品监管领域的研究探索。清单列出了 15 个应用场景,如说明书适老化改造、业务办理及政策咨询等。
马斯克回应英伟达黄仁勋:未来人形机器人普及将是汽车10倍
近日,英伟达CEO黄仁勋最近在一次采访中表示,机器人技术将在2-3年内取得重大突破,并预言未来人形机器人将变得像今天的汽车一样普遍,他表示:“100年后人形机器人将无处不在,可能成为人类历史上产量最大的机器系统。”一位X用户分享了黄仁勋采访的视频片段,马斯克则对此称:“它们的普及程度将是汽车的10倍。”
2024年6月18日·周二
DeepSeek Coder V2开源发布,首超GPT4-Turbo的代码能力
今天,全球首个在代码、数学能力上与GPT-4-Turbo争锋的模型,DeepSeek-Coder-V2,正式上线和开源。DeepSeek-Coder-V2 沿用 DeepSeek-V2 的模型结构,总参数 236B,激活 21B,在代码、数学的多个榜单上位居全球第二,介于最强闭源模型 GPT-4o 和 GPT-4-Turbo 之间。
华为盘古大模型5.0、全新小艺将于6月21日发布
华为官方今天发布预告,盘古大模型5.0、全新小艺将于6月21日开启的华为开发者大会上登场,倒计时3天。据悉,华为盘古系列基础大模型于2021发布,包括NLP、CV和科学计算大模型、预测大模型等。预计这次盘古大模型5.0也将带来诸多重磅升级,而全新小艺也将接入盘古大模型5.0,为手机等设备带来更智能的体验。
Canalys 预计今年全球 AI 手机市场份额达 16%,2028 年将过半
根据 Canalys 对具有生成式 AI 能力智能手机市场的调研预测,2024 年,AI 手机出货量预计占全球智能手机出货量的 16%,到 2028 年,这一比例将激增至 54%。从 2023 年到 2028 年,AI 手机市场年均复合增长率(CAGR)将达到 63%。
李彦宏:智能体是AI时代的网站,将形成数百万量级生态
近日,百度创始人、董事长兼首席执行官李彦宏在百度内部分享中表示,智能体是AI时代的网站,将会有几百万、甚至更大量的智能体出现,形成庞大生态。李彦宏分析,智能体就像互联网时代的网站,门槛足够低。
Runway 推出新的视频生成基础模型 Gen-3 Alpha
AI视频生成初创公司Runway推出了新的视频生成基础模型 Gen-3 Alpha 。该模型可以创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。虽然生成的视频只有10秒左右,但在清晰度、细节、角色一致性等方面看起来可以匹敌现有一切视频生成模型。
IMF:对人工智能造成大规模失业、不平等加剧的可能性深感担忧
当地时间周一,国际货币基金组织(IMF)刊出了一份名为《拓宽生成式人工智能的收益:财政政策作用》的经济学研究报告。IMF在报告中表示,生成式人工智能具有巨大的潜力,能够促进生产力增长和推进公共服务的可及性。但该组织也警告称,这种技术引发了有关“大规模失业和不平等问题不断加剧”的深刻担忧。
抖音联合博纳出品 AIGC 科幻短剧集《三星堆:未来启示录》
上海国际电影节期间,由博纳影业 AIGMS 制作中心出品制作,抖音联合出品的 AIGC 科幻短剧集《三星堆:未来启示录》亮相 ” 博纳 25 周年‘向新而生’发布会 “。作为首席技术支持,即梦 AI 为该剧提供生成式人工智能技术支持。该剧第一季共 12 集,由抖音联合出品,将在抖音短剧暑期档播出。此次合作是传统影视公司与 AIGC 视频产品首次联合开发 AIGC 科幻短剧集。
2024年6月17日·周一
AI教育科技初创公司「柯南AI」完成数百万元天使轮融资
柯南(广东横琴)智能科技有限公司(以下简称「柯南AI」)近日完成数百万元天使轮融资,投资方为六丰集团和鉴面科技的创始人,华峰资本担任独家财务顾问。「柯南AI」成立于2024年,是一家专注研发AI+儿童教育产品的科技创新的企业。其近期推出基于自研 AI大模型的AI+儿童教育产品“神笔马良魔画AI平板”,是一款集成AI绘画、AI写作、AI动画制作和AI音乐制作等数十个AI工具的平板电脑。
软银与AI搜索初创公司Perplexity AI达成战略合作
国际投资集团软银公司与人工智能企业Perplexity AI宣布建立战略合作关系。双方将致力于人工智能技术的研发与应用,旨在增强各自在相关领域的竞争力。通过此次合作,双方期望能够实现技术共享与创新,推动人工智能领域的进一步发展。
Gurman:苹果 Apple Intelligence 功能分批上线,重磅功能要等到明年
彭博社记者 Mark Gurman 透露“Apple Intelligence”仍将在 2024 年秋季上线,但并不会包含 WWDC24 上展示的所有功能。因此,最初发布时将带有“预览版”的标签,以表明其仍处于开发阶段。一些主要的缺失功能包括 Siri 理解设备内容、语义索引、允许人工智能控制设备以及屏幕感知功能,所有这些功能都将在 2025 年某个时候上线。
OpenAI 回应:非营利组织是公司核心使命
据 The Information 上周五援引知情人士消息称,OpenAI 首席执行官阿尔特曼告诉一些股东,公司正在考虑改变其治理结构,非盈利董事会将不控制营利性业务。OpenAI 在回复路透社有关该报道的询问时表示,“我们仍然专注于打造造福于每个人的人工智能。非营利组织是我们的核心使命,并将继续存在。”
2024年6月15日·周六
英伟达开源通用大模型Nemotron-4 340B
本周五,英伟达宣布推出 Nemotron-4 340B。它包含一系列开放模型,开发人员可以使用这些模型生成合成数据,用于训练大语言模型(LLM),可用于医疗健康、金融、制造、零售等所有行业的商业应用。通过独特的开放模型许可,Nemotron-4 340B 为开发人员提供了一种免费、可扩展的方式来生成合成数据,从而帮助人们构建强大的 LLM。
聆心智能发布新一代超拟人大模型CharacterGLM Pro
2023年8月,初代CharacterGLM发布,模型尺寸66B,在各项拟人化和角色扮演的性能指标上完全不输给当时OpenAI的GPT-4大模型。聆心智能经过大半年的持续努力,在落地服务客户,分析产品和用户反馈,重构和优化训练数据集,细化测评标准,以及大模型核心技术升级的基础上,于2024年2月份完成了CharacterGLM Pro版本的训练和初步测评。又经过了3个多月的持续打磨,CharacterGLM Pro的性能和稳定性得到了进一步提升。
OpenAI首席执行官称公司可能成为营利性公司
据The Information报道,OpenAI 首席执行官奥特曼(Sam Altman)最近告诉部分股东,OpenAI正在考虑将其治理结构转变为一家营利性企业,OpenAI 的非营利董事会无法控制该企业。奥特曼表示,董事会正在考虑的一种方案是成立一家营利性福利(for-profit benefit)公司,而Anthropic 和 xAI 等竞争对手正在采用这种方案。报道称,这样的变化可能为 OpenAI 最终进行首次公开募股(IPO)打开大门,目前OpenAI 公司估值为860亿美元(约合人民币6239.99亿元)。
因监管机构反对,Meta推迟在欧洲的AI聊天机器人推出计划
据彭博社等媒体消息,Facebook母公司Meta Platforms Inc.宣布,由于欧洲监管机构的干预,将无限期推迟原计划在欧洲推出的Meta AI聊天机器人。据悉,此举源于欧洲监管机构要求Meta暂停利用欧洲用户帖子训练大型语言模型的计划。
大模型四小龙CEO对谈:大模型是否是通往 AGI 之路的基石
6 月 14 日上午,国内大模型四小龙:百川智能 CEO 王小川、智谱 AI CEO 张鹏、月之暗面 CEO 杨植麟、面壁智能 CEO 李大海在 2024 年智源大会上就“大模型是否是通往 AGI 之路的基石”展开深入探讨,各位嘉宾分享了他们对大模型在 AGI 发展中关键作用的见解。
智源发布大模型“全家桶”以及管理超4600个AI加速卡的智算系统
6月14日上午举行的2024北京智源大会上,北京智源人工智能研究院公布一系列大模型“全家桶”和智算软件系统。其中包括发布万亿参数的大语言模型进展,用于检索增强(RAG)的向量模型、采用自回归架构的多模态大模型、具身智能大模型和生物计算大模型,以及支持8种芯片的智算操作系统FlagOS。
Sora负责人Ramesh:文生视频领域正在进入一个新的范式转换阶段
Sora团队研究负责人,DALL·E系列主要作者Aditya Ramesh在北京智源大会上分享了从iGPT和DALL·E 1开始,OpenAI在图像和视频生成领域所发现的一系列范式改变:CLIP的成功,文字描述在图像生成模型训练中越来越重要的地位。Aditya认为,在AI领域,事物正在统一成一种单一范式——Transformer,目标函数也已经优化到可以固定的水平了。因此现在这个新的阶段,AI科研人员需要去做的就是去攀登数据集,建构对我们想去模拟的东西的更好的数据结构建模。
字节跳动扣子平台上线“模型广场”,不同 AI 大模型匿名进行对战
字节跳动“扣子 Coze”公众号今日宣布,扣子平台上线“模型广场”功能,提供了一个大模型匿名打 PK 的“擂台”。用户可以在扣子官网(coze.cn)左侧导航栏中的“探索”列表找到“模型广场”,进入功能。其对战模式分为“随机 Bot 对战”“指定 Bot 对战”“纯模型对战”三种。
OpenAI任命美国国家安全局前局长为董事会成员
OpenAI在一份声明中宣布已任命美国退役陆军将军、美国国家安全局(NSA)前局长仲宗根(Paul M. Nakasone)为其董事会成员。声明称,仲宗根将加入OpenAI的安全和安保委员会,该委员会负责就OpenAI所有项目和运营的关键安全和安保决策向董事会建言。
智源研究院院长王仲远:AGI时代有可能会在未来几年到来
6月14日,2024智源大会在北京召开。在大会的开幕式致辞中,智源研究院院长王仲远介绍了智源的技术思路判断,和在多模态,具身智能以及AI for Science方面的研究进展,介绍了多个最新大模型。王仲远认为,因为过去几年模型的参数量从亿级发展到亿万级,距离人类大脑的参数仅有100倍距离。随着Sacling Law的持续实现有效,AGI时代有可能会在未来几年到来。
李开复:短期内中国大模型的商业机会在to C
“短期内,在中国to C市场更有机会,国外两者都有机会。”在今日的2024智源大会上,针对大模型相关话题,零一万物CEO李开复进行了最新的讨论,当被问及当下大模型产业化的最大场景和机会,李开复如是说。在李开复看来,从to C市场来看,大模型被认为像是移动互联网或者PC时代类似的技术,新的平台带来新的应用,这是巨大的机会,但是这些应用会按部就班进行,AI时代也是一样。
摩尔线程GPU千卡集群完成师者AI 70亿参数教育大模型训练测试
国产GPU芯片初创公司摩尔线程与全学科教育AI大模型“师者AI”联合宣布,双方已完成大模型训练测试。师者AI基于摩尔线程夸娥(KUAE)千卡智算集群,完成了其70亿参数大模型的高强度训练测试。整个训练过程用时一周,训练效率达到预期,充分展示了夸娥千卡智算集群作为国产全功能GPU千卡千亿训练平台的能力与优势。
马斯克:在现实世界中,特斯拉AI领先于OpenAI
特斯拉2024年度股东大会美东时间周四在美国得克萨斯州奥斯汀举行,经过投票,特斯拉股东批准了首席执行官马斯克560亿美元的薪酬方案,同时支持特斯拉将注册地从美国特拉华州迁往得州。关于特斯拉机器人Optimus,马斯克说相信Optimus将为公司带来巨大的利润。而在AI方面,马斯克表示,在现实世界中,特斯拉的AI领先Meta、谷歌、OpenAI。
领英(LinkedIn)宣布将推出系列AI求职顾问新功能
作为求职界的龙头公司之一,领英(LinkedIn)周四宣布将推出一系列由人工智能驱动的新服务,从申请工作到提供相关的准备材料,以及搜索整个领英以帮助用户更快地找到心仪职位。该功能仅面向领英的高级订阅者,个人求职者月费约30美元,企业订阅者月费约60美元。
2024年6月14日·周五
Hugging Face宣布以1000万美元收购数据集服务公司Argilla
Hugging Face 周四宣布,已同意以 1000 万美元收购名为 Argilla 的公司,这是 Huggingface 迄今为止第四笔收购。CEO Clément Delangue 透露,每周都会听到大约 10 家 AI 初创公司表示有意被收购,尤其是今年,这个数字增长很多,也可能是市场进一步整合的迹象。Delangue 还表示,Hugging Face 开发 AI 软件并将其托管给其他公司,由于拥有大量资源,它可能会吸引渴望被收购的企业。
三星领投AI芯片公司Tenstorrent新一轮融资,投前估值为20亿美元
据The Information报道,三星牵头对Tenstorrent进行了一轮至少3亿美元的投资。Tenstorrent是一家总部位于多伦多的人工智能芯片公司,其首席执行官吉姆·凯勒(Jim Keller)曾在苹果和特斯拉工作过。据参与这轮融资的两名人士透露,Tenstorrent的投前估值为20亿美元。
亚马逊承诺以AWS信用额度投资2.3亿美元,用于AI初创企业
亚马逊承诺以亚马逊云服务(AWS)的信用额度投资2.3亿美元,为处于早期阶段的人工智能初创企业提供指导和培训,以促进对人工智能和机器学习技术的使用。新承诺的一部分资金将用于资助第二批AWS生成式人工智能加速器,这一计划将为前80家使用生成式人工智能解决复杂挑战的早期初创企业提供专业知识,及每家高达100万美元的额度。
OpenAI CEO 奥特曼:中国将拥有独特的大语言模型
在近日在瑞士举行的2024年的人工智能向善全球峰会(AI for Good Global Summit)上,OpenAI首席执行官山姆·奥特曼(Sam Altman)通过视频连线与《大西洋月刊》的CEO尼古拉斯·汤普森(Nicholas Thompson)展开了深入的交流。奥特曼在对话中特别提到,中国将在这个领域扮演重要角色,孕育出具有本土特色的大语言模型。他预计,在未来将有10到20个大语言模型在全球范围内“存活”并发挥重要作用。此外,还提到GPT-4o能覆盖97%人群的母语,并承诺将持续改进,解决语言公平性问题。
Luma推出AI视频生成工具Dream Machine,120秒可生成120帧视频
Luma今天凌晨发布了效果堪比甚至超越Sora的视频生成工具 Dream Machine ,可通过文本、图片快速生成高质量视频,已上线公测可直接体验使用。该AI视频平台具有以下特色——特点1:非常快,120 秒生成 120帧;特点2:动作非常逼真、连贯;特点3:角色一致性极强,能够模拟物理世界;特点4:运镜非常自然,完美匹配场景情感。
Mozilla 升级 AI 建站服务 Solo:添加动画、放宽字符限制
Mozilla 于 2023 年 12 月推出名为 Solo 的全新项目,面向没有任何编程经验的用户,通过融入 AI 能力,所创建的网站可以媲美专业开发者的开发效果。Mozilla 时隔将近半年时间,推出了 Solo AI 1.0 重磅更新,通过引入更丰富的动画,让你的网站看起来更加精致。
OpenAI 将把国际游说团队人数增加至 50 人
OpenAI已将其国际游说团队(全球事务团队)的员工人数从 2023 年初的 3 人增加到 35 人,OpenAI计划到 2024 年底将该团队人数增加到 50 个。这一改变正值各地监管部门探索有关人工智能安全的立法之际,这些立法可能会影响OpenAI的发展。
阿里巴巴开源AI图像编辑融合框架MimicBrush
阿里巴巴、香港大学和蚂蚁集团的研究人员推出AI图像编辑融合框架 MimicBrush ,允许用户通过简单的操作,在源图像上指定需要编辑的区域,并提供一个包含期望效果的参考图像进行图片编辑,支持如对象替换、样式转换、纹理调整等图像编辑操作。
微软Copilot GPTs官宣停服,重点将转向商业和企业场景
微软近期在官网宣布,将于2024年7月10日起正式停止其Copilot GPTs服务,该服务允许用户创建和共享定制的特定任务聊天机器人。Copilot GPTs的发布仅3个月便宣告结束,引发了用户和业界的广泛关注。微软在其官网上表示,公司正在进行战略调整,将GPT的重点转向商业和企业场景,而非消费者市场,这一决策背后的可能原因是Copilot GPTs在商业回报上的缺乏。
苹果仍在寻找中国AI供应商,与OpenAI合作财务条款曝光
据彭博社报道,苹果公司本周发布了AI系统苹果智能( Apple Intelligence ),但是知情人士称,苹果尚未就聊天机器人功能与中国本土AI供应商达成协议,但一直在考虑与百度、阿里巴巴集团等公司合作。与此同时,彭博社还披露了苹果与OpenAI合作的财务条款。目前,如果用户通过ChatGPT应用在苹果设备上订阅OpenAI,这个过程将使用苹果的支付平台,传统上苹果会从中分成。
消息称 OpenAI 年化营收翻倍至 34 亿美元
据 The Information 今日凌晨援引不具名人士消息称,OpenAI 首席执行官山姆・奥特曼对员工表示,在过去约六个月的时间里,公司年化营收达到了 34 亿美元,相比去年年底翻了一番。奥特曼还提到,OpenAI 通过微软 Azure 提供人工智能模型接入,也有望获得约 2 亿美元的营收。据悉,OpenAI 在 2023 年底时的年化营收还只有 16 亿美元,去年夏天时约为 10 亿美元。
2024年6月13日·周四
Stability AI开源Stable Diffusion 3 Medium文生图模型
人工智能初创公司Stability AI宣布正式开源发布其最新的文本到图像生成模型——Stable Diffusion 3 Medium(SD3 Medium)。Stable Diffusion 3 Medium 包含 20 亿个参数,是 Stability AI 迄今为止最先进的文本到图像开放模型,更小的 VRAM 占用空间旨在使其更适合在消费级 GPU 以及企业级 GPU 上运行。
智源研究院院长王仲远:中国AI发展不会被阻碍
今年6月14日至15日召开2024北京智源大会前夕,王仲远博士与钛媒体进行了约1小时的独家对话。王仲远认为,当前美国政府对于中国 AI 技术发展加以限制,然而,美国只会延缓,但不会阻碍中国 AI 技术的长期发展,所以,《ENFORCE 法案》对于中国 AI 技术发展不会产生特别大的影响。
国家网信办发布第六批深度合成服务算法备案信息,腾讯混元等492个算法在列
国家网信办昨日发布公告,根据《互联网信息服务深度合成管理规定》,现公开发布第六批境内深度合成服务算法备案信息。AI工具集从《境内深度合成服务算法备案清单(2024 年 6 月)》文件获悉,本次共有 492 个算法通过备案,其中包括腾讯混元大模型多模态算法(应用产品为腾讯元宝)、零一万物大模型多模态生成算法、快手快意大模型生成合成算法、商汤V-ME视频合成算法、钉钉AI助理智能生成算法等、绘蛙电商模特试装图像合成算法等。
OpenAI 紧急澄清,和微软云合作不会变化
OpenAI 在社交平台 X 上正式回应了与美国第四大云服务提供商甲骨文的合作关系:“我们想要消除一些无意中产生的误解。我们与微软的战略性云合作关系没有变化。我们与OCI(Oracle Cloud Infrastructure,甲骨文云基础设施)的合作使我们能够在OCI的基础设施上使用微软的 Azure AI 平台来进行推理和其他需求。我们所有前沿模型的预训练仍然在与微软合作构建的超级计算机上进行。”事情的起因要追溯到甲骨文首席执行官 Safra Catz 今天凌晨宣布的消息。他表示,甲骨文在第四季度就签署了 30 多份 AI 销售合同,总额超过 125 亿美元,其中包括与 OpenAI 合作,在 Oracle Cloud 中训练 ChatGPT。
秘塔AI搜索上线Android和iOS移动端APP AI搜索引擎
秘塔AI搜索 宣布上线Android和iOS移动端APP,功能包括:一、全网搜索:(1)为用户提问提供直接、精准的答案,并包含引用源;自动生成大纲、思维导图、相关事件和人物;一键导出搜索报告,支持Word和PDF格式。二、学术搜索:(1)在数亿篇文献中筛选有用信息,助力学术研究;(2)快速提取摘要等关键信息,在搜索页清晰展示。
郭明錤:目前Apple Intelligence装置端AI大模型对DRAM的需求约为2GB或更低
6月12日,跟踪苹果产业链多年的天风国际证券分析师郭明錤发布报告指出,从配备A16的iPhone 15无法支持Apple Intelligence,但M1的机型可以支持,这推论出能否支持目前Apple Intelligence装置端模型的关键应该是DRAM大小,而不是AI算力(TOPS)。M1的AI算力约为11 TOPS,低于A16的17 TOPS。但A16的DRAM为6GB,低于M1的8GB。因此,目前的Apple Intelligence装置端AI LLM对DRAM的需求约为2GB或更低。
谷歌工程师批评 OpenAI,称其延缓 AGI 研究进展
TradingView 报道称,谷歌软件工程师弗朗索瓦・肖莱(François Chollet)在播客与主持人 Dwarkesh Patel 对话时,表达了他对 AGI(通用人工智能,Artificial General Intelligence)研究现状的担忧。肖莱表示,几年前所有最先进的研究成果都是公开分享和发表的,但现在情况已经不再如此。他将这一变化归因于 OpenAI 的影响,指责他们导致了“前沿研究出版的完全关闭”。
壁仞科技联合创始人徐凌杰再创业,瞄向大模型基础设施
离职5个月后,AI芯片公司壁仞科技前联合创始人徐凌杰再创业,新公司于2024年6月3日成立,名为魔形智能科技(上海)有限公司。据豹料台消息,徐凌杰的新公司致力于提供面向大模型的软硬件一体优化平台,从而降低大模型的使用成本。此外,还有一位国际头部GPU厂家的中国区高管强势加盟。
美图设计室发布V3版本:支持AI批量设计和商品视频生成
美图公司旗下的AI图像和设计创作平台 美图设计室 今日宣布更新至V3版本,本次更新新增3大核心能力:AI批量设计、AI商品视频和团队协作,解决电商设计难点。据悉,美图设计室目前每月活跃用户数超过1700万,每月产生的电商物料数量达4000万。
韩国两家AI芯片制造商Sapeon Korea和Rebellions寻求合并
韩国两家AI芯片制造商Sapeon Korea和Rebellions周三表示,为了在全球AI芯片市场站稳脚跟,将寻求合并。两公司计划寻求股东的批准,争取在9月底之前完成合并。据两公司的高管称,合并后的实体将于今年年底推出。Sapeon是韩国最大的移动通信公司SK电信旗下的AI芯片处理器子公司,Rebellions是成立于2020年的一家AI芯片初创公司。今年1月,Rebellions曾获1.24亿美元融资。
三星聘请苹果Siri战略资深人士领导北美人工智能中心
据知情人士透露,三星正在创建一个名为北美人工智能中心(North America AI Center)的新机构,将多伦多和加利福尼亚山景城的团队合并在一起。公司聘请了前苹果公司高管Murat Akbacak来管理新部门。Akbacak此前在苹果负责制定和执行个人助理Siri的战略,专注于个性化、情境化以及对话和多模式人工智能。
字节跳动相关人士回应“研发 AI 手机”:实为基于手机的大模型软件解决方案
近日有媒体报道称字节跳动已于两个月前秘密启动AI手机研发项目。新浪科技求证字节跳动,字节跳动相关人士称:信息不实,实际上是在探索基于手机的大模型软件解决方案,提供给手机厂商参考使用。目前并没有自己做手机并销售的计划。
上海交大发布LLM手机推理框架PowerInfer-2,可流畅运行470亿参数模型
上海交大IPADS实验室推出了面向手机的大模型推理引擎(目前论文已在arxiv公开):PowerInfer-2.0。PowerInfer-2.0能够在内存有限的智能手机上实现快速推理,让Mixtral 47B模型在手机上达到11 tokens/s的速度。与热门开源推理框架llama.cpp相比,PowerInfer-2.0的推理加速比平均达到25倍,最高达29倍。
消息称 OpenAI 奥特曼和三星李在镕首次单独会面,讨论合作 AI 芯片
据《韩国时报》援引知情人士消息,OpenAI CEO 山姆・阿尔特曼近日会见了正在美国出差的三星集团会长李在镕。与此同时,OpenAI 刚刚与苹果签署了合作伙伴关系。报道称,阿尔特曼和李在镕于上周末在硅谷进行了会面,这是双方第一次单独见面。阿尔特曼曾在今年 1 月访问了韩国,并参观了三星电子的半导体工厂。报道提到,双方讨论了人工智能(AI)芯片的合作问题。
2024年6月12日·周三
美政府被曝正考虑再出招限制中国获取用于人工智能的芯片技术,中方此前已表态
据彭博社当地时间11日报道,知情人士透露,拜登政府正在考虑进一步限制中国获取用于人工智能(AI)的芯片技术,此次锁定的目标是一款最新进入市场的新型硬件技术。对于美国频繁在芯片领域对华发难,中国外交部此前已明确表态,美方应将“不寻求与华脱钩”“不阻碍中国发展”的承诺落到实处,停止保护主义做法,停止对华科技封锁限制,停止扰乱国际经贸秩序。
马斯克撤销对OpenAI及奥特曼诉讼,不排除再起诉可能
据国外媒体报道,美国当地时间周二,特斯拉首席执行官埃隆·马斯克(Elon Musk)撤回了针对OpenAI及其两位联合创始人的诉讼。这起诉讼还质疑了ChatGPT所有者OpenAI与微软的合作关系。根据法庭文件,马斯克的律师在周二提出了无偏见的驳回请求,意味着该案件在未来仍有可能被重新提起。
苹果高管:正努力将“Apple Intelligence”引入中国市场
苹果在 WWDC 2024 上发布了备受瞩目的 iOS 18 和 macOS 15 系统,其中一项重要的新功能是“Apple Intelligence”。该功能将于今年晚些时候正式上线,苹果软件工程主管 Craig Federighi 在接受 Fast Company 采访时透露了一些关于 Apple Intelligence 的未来发展计划。Federighi 表示苹果正在努力寻找将“Apple Intelligence”引入中国市场的方法,“虽然目前没有具体的时间表,但这肯定是我们想要做的。”“Apple Intelligence”初期将仅支持美国英语,尚不清楚其他地区的用户是否能够使用该功能。
苹果 CEO 库克:Apple Intelligence 幻觉无法避免但质量绝不妥协
在《华盛顿邮报》最近的一次访谈中,苹果 CEO 蒂姆库克(Tim Cook)承认,苹果 AI 系统(Apple Intelligence)可能会出现幻觉,但仍可保证“非常高的质量”。库克还表示,苹果公司在进军 AI 领域时一直坚持自身的价值观,绝不会妥协,并且他们已经为即将推出的 AI 功能设置了安全保障措施。
北京市人工智能产业投资基金入股AI芯片独角兽「昆仑芯」
近日,昆仑芯(北京)科技有限公司(以下简称昆仑芯)发生工商变更,新增北京市人工智能产业投资基金、社保基金中关村自主创新投资基金(北京)合伙企业(有限合伙)为股东,同时,公司注册资本由约1808.48万元增至约1835.08万元。此前北京市人工智能产业投资基金五次出手皆为大模型企业,如今却转换细分方向,选择入资了一家AI芯片公司。此举或为北京在布局大模型产业上下游,以及助力北京市芯片产业发展。
复旦大学:将在下一个学年推出至少100门AI领域课程
6月11日,复旦大学召开2024年招生培养政策发布会,公布今年本科生招生培养政策亮点。从今年秋季学期开始,复旦大学将在2024-2025学年推出至少100门AI领域课程,打开AI+融合创新人才培养新局面。AI大课将以AI-BEST课程体系的形式,进入所有复旦学生的学业安排,分别为:本研一体化打造AI通识基础课程(AI-B)、AI专业核心课程(AI-E)、AI学科进阶课程(AI-S)和AI垂域应用课程(AI-T)。
极佳科技联合清华大学发布端侧可用的Sora级视频生成大模型
近日,在奇绩创坛路演日上,世界模型公司「极佳科技」联合清华大学自动化系正式发布中国首个超长时长、高性价比、端侧可用的 Sora 级视频生成大模型「视界一粟 YiSu」。「视界一粟 YiSu」拥有模型原生的 16 秒超长时长,并可生成至 1 分钟以上;同时还拥有超大运动、超强表现力、懂物理世界等众多优势;更重要的是,YiSu 模型成本更低、速度更快、端侧可用。
消息称字节跳动秘密启动AI手机/终端研发项目
据AR圈报道,字节跳动已于两个月前秘密启动AI手机研发项目。该项目核心团队主要由两部分人员构成:一部分来自2019年字节收购的锤子手机研发团队,另一部分则来自2021年收购的PICO VR研发团队。字节此次在AI领域的布局,其实并不局限于手机,而是着眼于”AI终端”的广阔前景。这里所说的AI终端,涵盖了手机、眼镜和耳机等多种形态。只不过在当前阶段,字节重点研发的项目以AI手机与AI眼镜为先导。
2024年6月11日·周二
苹果 WWDC 召开:发布 AI 全家桶,GPT-4o 加入 iOS 18
今日凌晨,苹果召开了本届 WWDC24(苹果全球开发者大会),发布了 Apple 智能(Apple Intelligence),他们把这称为一种新的个人智能系统,将生成模型集成到 iPhone,iPad 和苹果电脑中。该系统利用先进的人工智能和机器学习,通过理解个人情境、确定通知的优先级、提供智能写作工具、创建自定义图像以及自动执行跨应用程序的操作来增强用户体验。在发布会上,苹果也正式宣布与 OpenAI 达成合作。未来 ChatGPT 将被整合到 Siri 当中 ,并且被融入全系统的书写工具当中。用户无需注册账户。即可直接免费使用这一功能。而 ChatGPT 的付费订阅用户可以在这些操作系统中直接连接他们的账户,并享受付费功能的便捷访问。
OpenAI 正式宣布聘请新的 CFO 与 CPO
6 月 10 日,OpenAI 正式宣布聘请了 Sarah Friar 和 Kevin Weil 分别担任 CFO(首席财务官)以及 CPO(首席产品官)职务。CEO Sam Altman 表示,这将使 OpenAI 能够扩大业务规模,为下一阶段的增长制定战略,并确保我们的团队拥有继续发展所需的资源。此外,OpenAI 收入可能在未来 12 个月内超过 20 亿美元。
Meta 面临隐私问题,试图利用欧洲数据训练人工智能模型
社交媒体巨头Meta周一表示,希望利用隐私意识较强的欧洲用户的数据来训练其人工智能模型。该公司在努力追赶OpenAI和谷歌等竞争对手的同时,面临着数据保护方面的担忧。这家拥有Facebook、Instagram和WhatsApp的公司表示,为了更好地反映其欧洲用户的“语言、地理和文化情况参考”,它需要使用这些用户的公开数据来培训其Llama AI大型语言模型。
马斯克:若苹果操作系统整合OpenAI,我的公司将不许使用苹果设备
苹果的年度WWDC全球开发者大会如期在手机iPhone、电脑Mac和平板电脑iPad等主流硬件设备操作系统中融入AI功能,特别是可以通过Siri智能助手向ChatGPT提问。马斯克威胁称,由于OpenAI不尊重用户的数据隐私,若苹果在操作系统级别整合入ChatGPT的功能,他旗下的所有公司将禁止使用苹果设备,访客需要把设备存放到法拉第笼中。仅他旗下最大的公司特斯拉在全球雇员便超过14万。
不只 ChatGPT,苹果希望将谷歌 Gemini 等其他 AI 模型也添加到 iOS 18 中
在宣布与 OpenAI 旗下的 ChatGPT 达成合作后,苹果软件工程高级副总裁 Craig Fedrighi 在 WWDC24 开发者大会上确认了与其它第三方模型合作的计划。Fedrighi 在主题演讲后的采访中透露:“我们期待在未来与其它 AI 模型集成,例如谷歌的 Gemini。”OpenAI 的 ChatGPT 将在今年晚些时候成为第一个集成至苹果系统的 AI 模型。
2024年6月9日·周日
微信输入法内测AI功能:输入后按等号键=获取AI回答
近日,微信输入法团队推出了Windows v1.2.0.585版本的内测更新,其中最大的更新就是集成了AI助手。根据更新日志,用户在使用输入法时,只需输入相关内容,并按下等号键“=”即可直接获取AI生成的回答。
OpenAI 自研芯片进展曝光,百万年薪挖角谷歌 TPU 人才
OpenAI自研芯片的计划终于看到了实质性进展。据SemiAnalysis的最新报道,OpenAI最近开始大规模招募,计划将只有几个人的芯片团队扩展到几十个人。而且,他们延续了招聘人才的一贯策略——挖角谷歌。新近招募的几乎所有研究人员,都是现任或前任的谷歌TPU团队成员。OpenAI之所以瞄准谷歌的TPU团队,既是希望得到最先进的技术和人才,也同样有商业竞争上的考量。在硅谷的众多科技巨头中,只有谷歌研发的TPU能成功替代英伟达的芯片,并部署在公司内部的云服务中。
华为宣称Ascend 910B AI芯片成功超越A100
成为中国市场的重要替代品 据《南华早报》报道,华为高管表示,华为面向中国市场推出的尖端Ascend 910B AI芯片在性能上已超越英伟达A100 AI GPU。华为大幅提升Ascend平台性能,Ascend 910B以更高的性能和价值挑战英伟达A100,专为中国设计。
AI 视频初创公司 HeyGen 强制要求红杉中国、真格等中国风投机构把股份卖给美国投资者
据报道,成立于深圳、后来把总部迁到美国洛杉矶的生成式 AI 初创公司HeyGen,要求其中国投资者IDG资本、百度风投、红杉中国、真格基金(ZhenFund)把股权卖给美国投资者。知情人士称,美国投资者和HeyGen创始人徐卓(Joshua Xu)希望“整顿股权结构表(cap table)”,即投资者名单,因为美国方面正在加强对中国科技集团和跨境投资的审查。
2024年6月8日·周六
字节跳动上线 AI 虚拟交友聊天平台“小黄蕉”
消息显示,一款非常丝滑的 AI 虚拟交友聊天产品日前上线,中文名为“ 小黄蕉 ”,英文为Chatwiz,可以生成照片,非常接近真人对话情景。据钛媒体报道,根据工商信息发现,“小黄蕉”注册商标的工商主体为北京臻鼎科技有限公司(番茄小说),穿透后为北京抖音信息服务有限公司100%持股,即字节跳动公司。
AI 法律科技初创公司 Harvey 寻求 20 亿美元估值
知情人士称,法律人工智能初创公司Harvey一直在与投资者商谈融资6亿美元的事宜,公司估值至少20亿美元。Harvey告诉潜在投资者,如果能筹集到这么多资金,Harvey就有可能用这笔新资金收购法律研究服务公司vLex,以训练自己的产品。
DuckDuckGo AI Chat 聊天机器人发布,可免费匿名使用 GPT 等大模型
专注于保护用户隐私的搜索引擎 DuckDuckGo,周四官宣向用户免费开放 DuckDuckGo AI Chat,这是一个可以选择匿名访问 OpenAI GPT 3.5 Turbo、Anthropic’s Claude 3 Haiku、Meta Llama 3 、Mixtral 8x7B 的生成式 AI 聊天机器人。官方也宣称计划在未来增加可访问聊天机器人模型的数量。
字节跳动计划在马来西亚投资21亿美元建区域人工智能中心
马来西亚贸易与工业部部长扎夫鲁6月7日在社交媒体X发文称,字节跳动计划在马来西亚投资100亿林吉特(约合21亿美元)以建立一个区域人工智能中心。扎夫鲁称,字节跳动还计划额外追加15亿林吉特投资扩建其在马来西亚柔佛州的现有数据中心设施。扎夫鲁表示,字节的追加投资将有助马来西亚实现到2025年数字经济占GDP比重增长到22.6%的目标。
2024年6月7日·周五
阿里云开源推出通义千问 Qwen2 大模型,上下文窗口最高达 128K
阿里云通义千问宣布 Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级。目前,已在Hugging Face和ModelScope上同步开源 Qwen2 大模型。更新包括:5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;多个评测基准上的领先表现;代码和数学能力显著提升;增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。
消息称 Humane 正谈判以 10 亿美元的价格出售给惠普
此前有传言称 Humane 正在为其 AI Pin 业务寻找潜在买家,而一份新报告表明惠普可能是其中的竞争者。据《纽约时报》报道,在 Humane 的 699 美元可穿戴 AI Pin 受到广泛批评后一周左右,该公司开始与惠普洽谈以 10 亿美元以上的价格出售其业务。上个月,彭博社曾报道称 Humane “希望以 7.5 亿至 10 亿美元的价格被收购”。另外,惠普曾在 2010 年以 12 亿美元收购了 Palm 硬件及其 webOS 操作系统。
2024年6月6日·周四
字节推出Seed-TTS文本到语音模型,可生成媲美人类的语音
字节跳动的团队最新提出了名为 Seed-TTS 的技术,这是一系列大规模自回归文本转语音 (TTS) 模型,能够生成几乎与人类语音无法区分的语音。Seed-TTS 是语音生成的基础模型,在语音上下文学习方面表现出色,在说话人相似性和自然度方面的表现与客观和主观评估中的真实人类语音相匹配。
iOS 版 ChatGPT App 更新,支持在后台对话
距离苹果与 OpenAI 达成官方合作、将类似 ChatGPT 的智能功能引入 iOS 18 仅剩几天时间。在这一重磅消息揭晓前夕,ChatGPT 官方 iOS 应用迎来重大更新(1.2024.150),用户现在可以在使用其他应用的同时继续与 ChatGPT 进行对话。这将为 iPhone 用户带来媲美桌面端的强大交互体验。
马斯克的xAI据称拟在孟菲斯开发超级计算机,为Grok提供算力
据媒体报道,特斯拉CEO埃隆·马斯克麾下的人工智能(AI)公司xAI计划在美国孟菲斯建设一个新工厂,以容纳一台巨型超级计算机。上月有媒体报道称,马斯克告诉投资者,xAI正计划建造一台超级计算机,为其下一版Grok提供算力。
壁智能宣布小钢炮 MiniCPM 模型免费商用 作为开源社区的贡献者和受益者
面壁智能、OpenBMB & 清华 NLP 实验室讨论决定将面壁「小钢炮」 MiniCPM 免费商用。即日起, MiniCPM 和 MiniCPM-V 权重将对学术研究完全开放,并且企业、个人在填写问卷登记后亦允许商业使用,社区使用 MiniCPM 系列模型需要遵循 Apache 2.0 和《MiniCPM 模型社区许可协议》。
智谱 AI 宣布全模型矩阵降价:GLM-4-Flash 模型降至 0.06 元 / 百万 Tokens
在今天举行的智谱 AI Open Day 上,智谱 AI 宣布全模型矩阵降价。具体价格为:GLM-4-Air、GLM-3-Turbo 现价 0.6 元 / 百万 Tokens、Embedding-2 现价 0.3 元 / 百万 Tokens、GLM-4-Flash 现价 0.06 元 / 百万 Tokens。
微软 Microsoft Designer 推出个性化 AI 贴纸制作器
据悉,微软旗下AI图像编辑器 Microsoft Designer 推出了全新“贴纸制作器”功能,使用户能够自由创建个性化的贴纸。该款贴纸制作器巧妙地结合了用户输入的文本内容,实时生成与之匹配的精美贴纸,无论是文档装饰、邀请函设计、海报创作、演示文稿美化,还是在社交媒体和消息应用中的个性化表达,都能轻松应对,为用户的作品增添独特的视觉效果。
智谱AI开源 GLM-4-9B 系列模型,通用能力超越 Llama 3
智谱AI今日推出了第四代 GLM 系列开源模型:GLM-4-9B。相较于第三代模型,数据量是 ChatGLM3-6B 模型的 3 倍以上,训练效率提高了 3.5 倍。基于强大的预训练基座,GLM-4-9B 的模型中英文综合性能相比 ChatGLM3-6B 提升了 40%,尤其是在中文对齐能力 AlignBench,指令遵从 IFeval,工程代码 Natural Code Bench 方面都取得了非常显著的提升。对比训练量更多的 Llama 3 8B 模型也没有逊色,英文方面有小幅领先,中文学科方面更是有着高达 50% 的提升。
2024年6月5日·周三
报道称马斯克关于特斯拉的AI芯片采购计划夸大其词,马斯克回应
媒体称,英伟达内部邮件显示,马斯克让英伟达将原本预留给特斯拉的几万颗H100芯片,优先发货给他旗下的社交媒体公司X和AI初创公司xAI,而非特斯拉,这导致特斯拉推迟收到价值超过5亿美元的GPU。马斯克回击称,特斯拉没有合适的场所来激活那些英伟达芯片,所以它们只会闲置在仓库里。
OpenAI 和谷歌 DeepMind 员工联名发声:高级人工智能风险巨大,亟需加强监管
OpenAI 和谷歌 DeepMind 的数名前任和现任员工近日联名发布公开信,对高级人工智能的潜在风险以及当前缺乏对人工智能科技公司的监管表示担忧。该公开信指出,人工智能的发展可能会带来一系列的风险,例如加剧现有社会的不平等、助长操控和虚假信息传播,以及失控的自主人工智能系统可能导致人类灭绝等。
AI初创公司Cohere以50亿美元估值融资4.5亿美元,英伟达、思科等参投
据路透社报道,消息人士透露,加拿大人工智能初创公司Cohere已从英伟达、Salesforce Venture、思科等投资者处筹集到4.5亿美元资金。这结束了Cohere长达数月的融资努力,而该公司仍在商谈以50亿美元的估值在同一轮融资中筹集更多资金。
2024年6月4日·周二
曝微软Azure云部门将裁员至少1500人以集中资源发展AI
据媒体报道,有消息人士透露称,微软Azure云部门据传将进行大规模裁员,预计裁员人数至少达到1500人。据透露,此次裁员主要集中在Azure云服务部门,影响了包括Azure运营商业务团队和任务工程团队在内的多个团队。其中一位知情人士估计,微软Azure运营商业务团队可能会裁掉多达1500人,微软的内部邮件和备忘录显示,本次裁员的主要目的是要集中资源发展微软的AI业务。
黄仁勋:下一波AI的浪潮是物理AI,机器人时代已经到来
6月2日晚间,台北国际电脑展(COMPUTEX)开幕前夕,英伟达CEO黄仁勋在台湾大学综合体育馆发表主题为“开启产业革命的全新时代”的现场演讲。在演讲中,黄仁勋强调了机器人和AI在未来发展中的重要性:“AI的新一波浪潮是物理AI。AI能够理解物理定律,并与人类并肩作战……机器人和物理AI正在成为现实,而不仅是出现在科幻小说,这真是令人兴奋。”
复旦大学发布“伏羲”2.0气象大模型
复旦大学和上海科学智能研究院昨日联合举办“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式。成立仪式上,伏羲系列气象大模型 2.0(简称“伏羲”2.0)发布,以“伏羲”2.0 为核心的智能气象创新生态联盟成立。相较于去年推出的 1.0 系列,“伏羲”2.0 的中期天气预报大模型和次季节大模型,面向新能源、航空运输等行业取得进展。
微软发布首个大气AI基础模型Aurora
微软研究团队开发了首个大气 AI 基础模型 Aurora,基于超过一百万小时的各种天气和气候数据进行训练。在不到一分钟的时间内,Aurora 就可以生成 5 天的全球空气污染预测和 10 天的高分辨率天气预报,其表现优于最先进的传统模拟工具和最好的专业深度学习模型。
澜舟科技开源轻量化大模型孟子3-8B,支持免费商用
在Mengzi3-13B大模型3月底开源后不久,澜舟科技全新推出的又一款轻量化大模型——Mengzi3-8B,现已正式开源!并同样支持免费商用。这款模型在多个应用场景中,包括写作、代码、摘要以及阅读理解等,均展现出与Mengzi3-13B相媲美的性能,而模型参数规模更为精简,更适合个人开发者和AI爱好者使用。
报道称OpenAI CEO奥特曼投资了400多家公司
作为OpenAI的CEO,奥特曼并不持有OpenAI的股份,他在公司的年薪约为6.5万美元。但有报道称,奥特曼的净资产最近突破了20亿美元大关。虽然不持有OpenAI股份,但奥特曼是硅谷最多产的个人投资者之一。近日有报道称,他已经投资了400多家公司,截至今年年初,其所持这些公司的股份至少价值28亿美元。
昆仑万维开源2千亿稀疏大模型天工MoE,支持单台4090推理
日前,昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE ,性能强劲,同时推理成本更低。Skywork-MoE 基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来,是首个完整将 MoE Upcycling 技术应用并落地的开源千亿 MoE大模型,也是首个支持用单台 4090 服务器推理的开源千亿 MoE大模型。
马斯克称将为 xAI 购买约 30 万块英伟达 AI 芯片,预估至少花费 90 亿美元
马斯克北京时间今天凌晨在回复一则投票时透露,xAI 的下一项重大举措可能是在明年夏天购买约 30 万块配备 CX8 网络的 B200 芯片。目前,xAI 计划通过加大对 GPU 集群的投资,大幅扩展其 AI 相关的产品组合。
AMD 公布新一代AI芯片MI350系列,推理性能大幅增涨
今天上午,AMD公司CEO苏姿丰(Lisa Su)在台北宣布,更新Instinct GPU系列路线图,将在每一代产品中带来年度领先的 AI 性能和内存功能,从而加速AMD在数据中心 AI 创新和领导地位。其中,全新 AMD Instinct MI325X AI加速器(芯片),将配备288GB HBM3E内存和 6TB/秒的内存带宽,采用与MI300系列相同设计。相比英伟达最强 AI 芯片H200,MI325X内存容量提高2倍、带宽提升1.3倍、计算性能提升1.3倍,最快2024年四季度上市。此外,MI350X加速器相比MI300系列,新的MI350系列的 AI 推理性能将提高惊人的35倍(3500%),预计将于2025年上市。
微软将向瑞典投资32亿美元加强AI和云服务设施
微软计划在瑞典投资32亿美元,用于人工智能AI和云服务设施,这是其在这个北欧国家有史以来最大的基础设施投资。此举将巩固这家科技巨头在瑞典的足迹,在其三个数据中心增加2万个图形处理器(GPU)。据周一的声明,该公司还承诺对25万人进行“基本AI技能”培训。
斯坦福团队 Llama3-V 被曝抄袭面壁智能的大模型
近日,斯坦福AI团队被曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果——模型结构和代码,几乎一模一样。斯坦福的这项研究叫做Llama3-V,是于5月29日新鲜发布,宣称只需要500美元就能训出一个SOTA多模态大模型,比GPT-4V、Gemini Ultra、Claude Opus都强。然而,一位网友发现,Llama3-V的模型结构和代码与出自清华系明星创业公司面壁智能的MiniCPM-Llama3-V 2.5几乎一模一样,只是变量名有所变化。
2024年6月3日·周一
英伟达公布新一代Rubin GPU和Vera CPU,预计2026年推出
6月2日晚,“AI教父”、英伟达创始人、CEO黄仁勋(Jensen Huang)宣布,英伟达打算每年都升级AI加速器/AI芯片,去年发布的Blackwell芯片现在开始投产,2025年将推出Blackwell Ultra,而下一代 AI 芯片架构平台名为Rubin,采用HBM4芯片,预计将于2026年推出。同时,黄仁勋还宣布推出推理模型微服务NVIDIA NIM,以部署在云、数据中心或工作站上,并且开发者能够轻松地为Copilot、ChatGPT等构建生成式 AI 应用。黄仁勋强调,未来,全球AI产业规模将高达100万亿美金,比之前IT时代的3万亿美元高出33万倍以上,具有强大的市场前景。
美国新闻媒体联盟要求调查谷歌在新闻领域的垄断行为
美国“新闻 / 媒体联盟”(News / Media Alliance)本周致信美国联邦贸易委员会和美国司法部,敦促两部门调查谷歌垄断数字新闻出版的行为,并要求阻止谷歌通过其“无处不在”的搜索产品中使用生成式 AI 进行进一步扩张。“新闻 / 媒体联盟”关注的焦点是谷歌最新推出的“AI Overviews(AI 概述)”,并声称这一功能擅自利用出版商内容对用户的查询作全面回应,因而引起人们的警惕。
2024年6月2日·周日
英伟达数字孪生地球“Earth-2”亮相,2 公里精确预测天气信息
在目前正在进行的黄仁勋台北电脑展 2024 主题演讲上,黄仁勋介绍了英伟达 Earth-2 数字孪生地球,该“地球”主要用于天气观测,基于英伟达 CorrDiff 生成式 AI 模型技术,号称融合了人工智能、物理模拟和观测数据,够从今天的数据来预测未来世界的影响。
科大讯飞:讯飞星火 V4.0 正在训练中,对标 GPT-4o 的产品也在研发
科大讯飞在“深交所互动易”平台回复网友提问时透露,对标 GPT-4 当前能力的讯飞星火 V4.0 正在训练中,预计在 2024 年 6 月底发布,对标 GPT-4o 的产品正在研发中。
2026年中国人形机器人产业规模或将突破200亿元
人形机器人无疑是未来感十足的一个代表产业。有机构发布的最新报告显示,预计到2026年,中国人形机器人产业规模将突破200亿元。在生成式人工智能技术大爆发的当下,未来,人形机器人更是极有可能实现超预期增长。
2024年6月1日·周六
阿里巴巴与世卫组织达成战略合作,全球推广达摩院 AI 癌症筛查技术
日前,联合国在瑞士日内瓦召开 AI for Good 全球峰会,阿里巴巴与世卫组织(WHO)数字健康合作中心达成战略合作,向全球推广达摩院 AI 癌症筛查技术。阿里巴巴表示,在国内,达摩院 AI 癌症早筛技术已经为超过 600 万人次提供服务,覆盖胰腺癌、食管癌、肠癌、胃癌、肝肿瘤等病症的筛查,国际上已经与安提瓜和巴布达卫生部达成战略合作。
硅基流动 SiliconCloud 公测上线,每人免费送 3 亿 Token
由袁进辉创立的 AI Infra 公司硅基流动(SiliconFlow)日前宣布推出集合主流开源大模型的一站式云服务平台 SiliconCloud ,为开发者提供更全面、更快、更便宜的模型API。自即日起至6.18为开发者赠送每人3亿token,注册即可畅玩。不同于多数大模型云服务平台只提供自家大模型API,SiliconCloud上架了包括DeepSeek V2、Mistral、LLaMA 3、Qwen、SDXL、InstantID在内的多种开源大语言模型、图片生成模型,支持用户自由切换符合不同应用场景的模型。
Hugging Face称检测到对其AI模型托管平台的“未经授权访问”
周五下午晚些时候,人工智能初创公司Hugging Face表示,其安全团队在本周早些时候检测到对Spaces的“未经授权访问”,Spaces是Hugging Face用于创建、共享和托管人工智能模型和资源的平台。本次入侵与 Spaces 秘密有关,即作为解锁账户、工具和开发环境等受保护资源的密钥的私人信息。作为预防措施,Hugging Face 已撤销了这些机密中的一些令牌(令牌用于验证身份)。目前还不清楚有多少用户或应用程序受到潜在漏洞的影响。
翠贝卡电影节将首映使用 OpenAI Sora 制作的五部短片
据报道,翠贝卡电影节(Tribeca Festival)将放映五部采用 OpenAI 技术制作的短片,这些电影使用 OpenAI 的 Sora 文生视频模型,是使用该技术的电影首次在电影节上展示。影片将于 6 月 15 日放映,之后将与电影制作人进行对谈。
蔡崇信:训练AI模型就像教育孩子,学习三四年就能赶超人类博士
上周,美国投行摩根大通在上海举办了第二十届全球中国峰会,阿里巴巴集团董事长蔡崇信期间与该行北亚区董事长兼大中华区投资银行业务副主席Kam Shing Kwang进行了对话。本周四,阿里巴巴方面对外公布了此次对话的全程视频实录。在此次对话中,蔡崇信详细剖析了人工智能所带来的价值和机遇,涉及人工智能的学习曲线、通用人工智能的前景、云与人工智能的融合应用、人工智能在垂直领域的具体实践,以及不同大模型间如何协同工作等多个方面。
谷歌对“AI Overview”功能的问题进行了紧急修复
当地时间周五,科技巨头谷歌宣布,在发现“AI概览”(AI Overviews)功能出现了一系列错误信息后,已经对其AI系统进行了“十多项技术改进和更新”。专家警告称,这种信息检索应该是谷歌的核心业务,不能急于把它交给AI模型。
Perplexity AI 推出 Pages 功能,可将网络搜索转换为文章页面
AI 搜索引擎公司 Perplexity AI 推出了名为“Pages”的全新功能,可以基于页面搜索结果内容,自动生成一份格式工整、内容详实的报告 / 文章 / 指南。Perplexity 表示,它的算法可以创建一篇包含不同章节的详细文章。用户可以要求人工智能工具改写或重新格式化任何部分,甚至删除它们。
消息称沙特阿美旗下风投基金Prosperity7参与智谱AI 4亿美元的一轮投资
据媒体周五报道,两位知情人士称,沙特阿美风险投资部门旗下基金Prosperity7参与了对中国人工智能初创企业智谱AI约4亿美元的新一轮投资。目前智谱AI估值约为30亿美元,本次投资也为智谱在中国以外地区开辟新市场提供了机会。
2024年5月31日·周五
学而思学习机智能助手“小思”升级:新增作业模式、圈圈学等功能
学而思学习机内置智能助手“小思”正式全新升级,新增了作业模式、圈圈学、AI口语分级练、小思对话等AI功能,在多个学习场景中为孩子和家长提供帮助。
OpenAI被美国反垄断机构盯上,美高官:媒体版权交易或涉垄断
随着“人工智能领头羊”OpenAI与越来越多的媒体公司签下合作协议,美国反垄断机构也投来了关注的目光。美东时间周四,美国司法部最高反垄断官员乔纳森•坎特(Jonathan Kanter)表示,美国司法部正在密切关注OpenAI等人工智能公司与内容创作者达成的交易,因为它们可能具有垄断嫌疑。
Suno 3.5 版本模型已向所有人开放,可制作4分钟歌曲
据 Suno 官方消息,AI 音乐工具 Suno 的最新 3.5 版本模型已经向所有人开放,这个版本的改进包括:可以制作4分钟的歌曲,创建最长2分钟的歌曲扩展,以及显著改进的歌曲结构。此前,Suno宣布将推出全新功能,可以将任何声音创作成歌曲。这项新功能能够将日常生活中的各种声音转化为音乐,为音乐创作带来了全新的可能性。
Claude 上线 Tool Use 功能,可与外部数据和工具交互
人工智能公司 Anthropic 宣布 AI 助手 Claude 的 Tool Use 功能已全面上线。该功能使 Claude 能够自主与外部数据源、API 和工具进行交互,以改变企业利用人工智能实现任务自动化、个性化推荐和简化数据分析的方式。对于使用 Anthropic Messages API、Amazon Bedrock 和 Google Vertex AI 的开发人员来说,Tool Use 现已在整个 Claude 3 模型系列中可用。
谷歌发布 Gemini 1.5 Pro 和 1.5 Flash 模型的稳定版和 API 更新
谷歌今日正式宣布推出 Gemini 1.5 Flash 和 1.5 Pro 稳定版,同时发布一系列 API 更新和Google AI Studio改进,将为开发者提供更高效、更经济的方式来大规模构建和部署 AI 应用。
英特尔、谷歌、微软、Meta等科技巨头成立联盟制定 AI 加速器连接标准
英特尔、谷歌、微软、Meta以及其他科技巨头周四宣布成立一个新的行业组织——“Ultra Accelerator Link (UALink) 推广组”,意在制定行业标准,领导数据中心中AI加速器芯片之间连接组件的发展,挑战英伟达在AI加速器一家独大的地位。分析认为,英伟达目前已提供互联技术,加上霸主地位稳固,目前英伟达没有动机也没有必要参与该联盟。
消息称苹果将用 AI 彻底改造 Siri,让其控制所有功能
5月31日,彭博记者、知名苹果爆料人Mark Gurman援引知情人士报道称,苹果公司计划使用更先进的人工智能对其 Siri 虚拟助手进行全面改造,这一举措将允许用户通过语音控制单独应用内的所有功能。据报道,新版本的Siri将能够更精准地操作和导航iPhone或iPad,实现打开特定文件、移动笔记、发送或删除邮件、打开Apple News中的特定出版物、发送网络链接或请求文章摘要等操作。
Altman 出席 AI 峰会,首次公开回应 OpenAI 治理和 AI 语音争议等问题
OpenAI首席执行官萨姆·奥特曼(Sam Altman)周四在联合国电信机构的年度AI for Good会议上通过视频发表了演讲,就如何利用人工智能技术的社会前景发表了讲话。在接受《大西洋月刊》首席执行官尼古拉斯·汤普森的采访时,奥特曼详细谈论了与人工智能相关的主题。但他回避了有关公司治理以及被罢免的董事会成员的批评等棘手问题。奥特曼在采访中首次就OpenAI使用酷似好莱坞影星斯嘉丽·约翰逊声音的AI语音一事引发的争议发表公开评论,强调“那不是她的声音”。
纳德拉:微软与OpenAI的合作关系和微软与英特尔的处于同一级别
据外媒报道,微软CEO萨提亚·纳德拉近日在接受美国科技网站采访时谈到了微软与OpenAI的合作关系,微软如何在整个公司内转向AI,以及微软与谷歌的竞争关系,微软的资本支出水平问题等等。纳德拉提到,微软与OpenAI的合作伙伴关系,和微软与英特尔的合作伙伴关系是处在同一级别的。“在2019年,我们想,也许微软应该大手笔投入到计算中,由于OpenAI比任何人都更坚信这一点,甚至超过微软内部一些人,于是我们就压下了赌注。”
OpenAI 重启之前一度被放弃的机器人团队
据国外媒体报道,据三位消息人士透露,随着对人工智能机器人的投资升温,OpenAI正式重启了此前被放弃的机器人团队。知情人士表示,OpenAI目前正在招募研究工程师以重建机器人团队,该团队已于2020年解散。尽管OpenAI尚未公开披露其自主研发机器人技术的具体细节,但在最近公布的招聘公告中,他们明确表示新加入的员工将成为“这个全新团队的首批成员之一”。
美国政府限制 AMD 和英伟达 AI 芯片向中东销售
据报道,美国官员已经放慢了向英伟达和AMD等芯片制造商发放向中东地区大批量出口AI加速计算芯片的许可证。与此同时,报道称,官员们正在对该地区的人工智能开发进行国家安全评估。知情人士称,目前尚不清楚评估需要多长时间,怎样才算大批量出口也没有具体定义。
OpenAI 推出 ChatGPT Edu 教育版本,支持 GPT-4o、自定义 GPT 等
OpenAI在官网宣布,推出ChatGPT Edu版本。据悉,这是一个专门为大学校园提供的ChatGPT,支持GPT-4o、网络搜索、自定义GPT、数据分析、代码生成等功能,可以极大提升学生、老师的学习质量和教学效率。目前,牛津、剑桥、伯明翰等24所“罗素大学集团”的全球顶尖大学,已经在教育中使用ChatGPT等生成式AI产品。而沃顿商学院、亚利桑那州立大学在今天也官宣与OpenAI进行合作,在教育领域深度应用ChatGPT。
昆仑万维宣布 Opera 浏览器接入端侧 AI 大模型
今日,昆仑万维宣布,其旗舰浏览器Opera One以及游戏浏览器Opera GX将正式接入端侧AI大模型,成为全球第一个接入端侧AI大模型的主流浏览器。2024年4月,Opera已在开发者版本浏览器中首次接入了端侧AI大模型,并进行了全面测试。昆仑万维表示,即日起,端侧AI大模型将被正式集成进Opera浏览器旗舰产品中,覆盖Windows、MacOS和Linux等全部设备。
2024年5月30日·周四
消息称 Altman 计划将 OpenAI 重组为营利性公司
据 The Information 今日报道,知情人士称 OpenAI CEO Sam Altman 正考虑将 OpenAI 重组为一家正规的营利性公司,重点解决公司性质与其营收业务的冲突。据一位与 Altman 交谈过的知情人士称,一种可能性是,Altman 可能会将 OpenAI 转变为一家营利性公司,“他也讨论过这个想法”。而 OpenAI 的一些投资者表示,他们希望 Altman 获得股权方案,以确保他的利益与公司业务保持一致。
OpenAI CTO:人工智能对经济的影响才刚刚开始
5月29日至31日,亚洲科技大会在新加坡召开。本周四,OpenAI公司首席技术官、被称为“ChatGPT之母”的米拉·穆拉蒂(Mira Murati)通过视频远程参加了这场会议。她在会议上发言表示,生成式人工智能才刚刚开始对经济产生影响。她表示:“我们还没有意识到它(人工智能)对商业和工作的影响,因为这才刚刚开始…但到目前为止,我们看到的是,在很短的时间内,这些人工智能系统已经作为合作者进入了劳动力市场。”
Grab与OpenAI宣布合作,在东南亚部署AI解决方案
东南亚科技公司Grab与OpenAI当地时间5月30日宣布,双方将合作构建和部署先进的人工智能解决方案。Grab将探索使用AI技术构建客服聊天机器人,更快地帮助用户解决问题。在地图绘制方面,Grab将利用OpenAI,通过自动化和更高质量视觉图像数据提取来增强应用的地图绘制工作,以更快地更新地图,为消费者和司机合作伙伴提供更好体验。
谷歌承诺在马来西亚投资20亿美元,将建数据中心、进一步开发AI
谷歌在马来西亚的投资承诺达到了20亿美元,标志着其在该地区首个数据中心和谷歌云计划的启动。Alphabet的首席财务官露丝·波拉特(Ruth Porat)宣称,这是谷歌在东南亚国家中最大规模的投资计划。谷歌还表示,除了开发云计算服务外,还将支持针对学生和教育工作者的人工智能素养计划。
清华团队发布世界首款类脑互补视觉芯片「天眸芯」
清华团队发布世界首款类脑互补视觉芯片——「天眸芯」。这是一种基于视觉原语的互补双通路类脑视觉感知新范式,标志着我国在类脑计算和类脑感知两个重要方向,取得的重大突破!研究《面向开放世界感知具有互补通路的视觉芯片》(A Vision Chip with Complementary Pathways for Open-world Sensing)一经发布,即登上Nature封面。
OpenAI 宣布自定义 GPT 等 GPT-4o 新功能现已向 ChatGPT 全体用户免费开放
ChatGPT 免费用户现已能够尝试自定义 GPT 模型、分析图表等其他 GPT-4o 新功能。当然,OpenAI 在推出 GPT-4o 时就承诺它将免费向所有用户开放,而付费用户的优势在于“拥有免费用户五倍的容量限制”。在此以前,诸如模型和网络响应、数据分析、图表创建、视觉、文件上传、内存和自定义 GPT 模型等功能仅对付费用户(ChatGPT Plus、Teams 和 Enterprise)开放,但现在已经面向所有 ChatGPT 用户开放(当免费用户使用 GPT-4o 达到消息或对话限制时将自动恢复到 GPT-3.5)。
欧盟宣布成立人工智能办公室,对 AI 进行监管
当地时间 5 月 29 日,欧盟宣布成立人工智能办公室,对人工智能进行监管,支持可信人工智能的发展和使用,同时防范人工智能风险。该办公室由包括技术专家、律师和经济学家在内的 140 名成员组成,设有首席科学顾问和国际事务顾问,分为 5 个部门:AI 与机器人技术、监管与合规、AI 创新与政策协调、AI 安全、AI 社会公益。
Arm 发布面向下一代旗舰手机 AI 功能的 CPU 和 GPU 架构
5月29日周三,日本软银集团旗下的英国芯片设计公司Arm控股发布了面向旗舰智能手机AI功能的下一代CPU和GPU设计,并将提供软件工具,让开发人员更容易在采用Arm架构的芯片上运行生成式AI聊天机器人和其他AI代码。预计搭载最新内核设计的手机将于2024年底上市。
OpenAI 与《大西洋月刊》和 Vox Media 达成内容合作协议
美国历史最悠久的杂志之一《大西洋月刊》(The Atlantic)和美国最大的数字媒体控股公司之一 Vox Media 都与 ChatGPT 的母公司 OpenAI 签订了单独的许可和产品协议。这两项多年期合作伙伴关系都包含一项协议,根据该协议,OpenAI 可以获得出版商的存档内容授权,以训练其人工智能模型。
消息称苹果 AI 服务器将使用“机密计算”技术来处理数据,保护用户隐私
据《The Information》报道,苹果计划采用“机密计算”技术,实现“黑箱处理”,既可以在其云端提供强大的 AI 处理能力,又能保持严格的隐私标准。。通常情况下,云服务仅在数据存储于磁盘时对其进行加密。但是,为了在服务器上处理或转换数据,就需要将数据解密到内存中。报道称,在过去的三年里,苹果一直在进行一个秘密项目。该项目在内部被称为“苹果数据中心芯片”( ACDC),而该 AI 芯片可以帮助苹果实现“黑匣子”计算方式。
Gartner:2024 年全球人工智能芯片销售收入将增长 33% 到 710 亿美元
根据研究分析公司 Gartner 的最新预测,2024 年全球人工智能半导体收入预计将达到 710 亿美元,较 2023 年增长 33%。Gartner 副总裁分析师 Alan Priestley 表示:“如今,生成式人工智能 (GenAI) 正在推动数据中心对高性能人工智能芯片的需求。到 2024 年,用于服务器的人工智能加速器的价值将达到 210 亿美元,到 2028 年将增至 330 亿美元。” Gartner 预测,2024 年人工智能 PC 出货量将占到 PC 总出货量的 22%,到 2026 年底,企业购买的 100% 的 PC 将是人工智能 PC。
中国石油、中国移动、华为、科大讯飞宣布共建昆仑大模型
据中国石油报消息,5 月 28 日,昆仑大模型建设研讨会暨合作共建签约仪式在京举行。中国石油、中国移动、华为、科大讯飞四家公司达成签约合作,将联手共建昆仑大模型,推动人工智能在能源化工行业的大模型开发建设和高水平应用。
字节再试AI硬件:用收购补充团队、两条产品线共发力
字节跳动正在AI领域倾注极大力量,除了在大模型应用等软件侧发力,其对AI+硬件的探索也未曾停止。据36氪报道,字节AI硬件方向的探索,在内部分为两条产品线:一条产品线代号为“D线”,负责人为李浩乾,其为OWS(Open Wearable Stereo,开放式可穿戴立体声耳机)耳机品牌Oladance创始人。不久前,字节收购了这一品牌。另一条产品线为O线,负责人也是字节曾收购公司的创始人,其向字节跳动技术副总裁洪定坤汇报。
普华永道将成为OpenAI最大的ChatGPT企业客户和首家经销商
普华永道将成为OpenAI企业产品的最大客户和首家经销商,这是两家公司5月29日宣布的新协议的一部分。普华永道表示,将向其7.5万名美国员工和2.6万名英国员工推出ChatGPT企业版。两家公司都拒绝透露交易的财务条款。普华永道去年曾宣布,计划在未来三年内向旗下美国业务的生成式AI技术投资10亿美元。
2024年5月29日·周三
腾讯推出“殷契文渊”甲骨文AI协同平台,可智能识别甲骨文并转为汉字
腾讯日前宣布推出“殷契文渊”甲骨文AI协同平台。这是腾讯携手合作伙伴为甲骨文研究专家和爱好者打造的在线研究平台和数据库。其网站经全面升级后,不仅引入创新工具来识别刻痕较浅的甲骨文,还采用人工智能(AI)技术将甲骨文字形映射到现代汉字,从而大幅提升效率。
商汤大模型5.0粤语版本发布,定价30港元1M tokens
商汤正式对外发布日日新大模型5.0粤语版,定价为30港元1M tokens(输入和输出同价),最大支持128K窗口。同时,“商量粤语版”将推出网页版及App版两个端口给公众使用。
智谱AI刘江:AGI 5~10年会达到普通人水平,智谱AI已启动“超级对齐”
智谱AI首席生态官刘江在2024亚马逊云科技中国峰会上表示,他认为5~10年内,AGI会达到普通人水平,“大模型可能是我们这一代人遇到的最大的技术突破。”刘江同时透露,智谱AI已经启动“超级对齐”。超级对齐(superalignment)是指确保在所有领域都超越人类智能的超级人工智能(AI)系统,按照人类的价值观和目标行事。
爆料称百度文心大模型5.0将在2025年发布
新浪科技从可靠知情人士处获悉,百度或将于2025年百度世界大会期间发布新一代文心大模型5.0。目前,文心大模型最新版本为4.0版本,该版本于2023年举办的百度世界大会上由百度创始人李彦宏发布,具备理解、生成、逻辑和记忆四大核心能力。
OpenAI 前董事 Helen Toner 透露 Altman 被罢免原因
OpenAI 前董事海伦·托纳(Helen Toner)近日接受了播客节目《The TED AI秀》的采访,对OpenAI驱逐奥特曼事件作出了迄今为止最全面的解释。据她透露,当奥特曼发布ChatGPT时,OpenAI董事会被蒙在鼓里,事后通过推特(现在的X)才知道这件事。“当ChatGPT在2022年11月推出时,董事会没有事先被告知这件事,”托纳表示,“我们是从推特上知道ChatGPT发布的。”她还批评了奥特曼在安全问题上的领导能力。“他曾经在多个场合向我们提供了有关公司实际正式安全流程的不准确信息,”她说,“这意味着董事会基本上不可能知道这些安全流程的运作情况如何,或者可能需要改变什么。”
OpenAI 前安全负责人 Jan Leike 宣布加入 Anthropic
本月早些时候从OpenAI辞职的首席安全研究员Jan Leike周二表示,他已加入竞争对手人工智能初创公司Anthropic。5月15日,雷克宣布从OpenAI辞职,几天后,该公司解散了他共同领导的超级对齐团队。该团队成立于2023年,专注于人工智能的长期风险。OpenAI联合创始人Ilya Sutskever较早时也宣布离职。Leike周二在X上写道:“我很高兴能加入AnthropicAI继续超级对齐使命,我的新团队将致力于可扩展的监督、从弱到强的泛化以及自动化校准研究。”
Chromebook Plus 笔记本迎来谷歌 Gemini 加持,AI 功能助力写作、图片处理等
谷歌宣布将把 Gemini 人工智能以及该公司其他设备上的 AI 功能引入 Chromebook Plus 笔记本电脑,其中包括华硕、惠普已经在售的机型,以及宏碁即将推出的新品。这些现有和未来的 Chromebook Plus 机型都将支持谷歌的“帮助我写作”等新功能,以及使用生成式 AI 创建自定义壁纸的功能。谷歌相册的魔法编辑器(Magic Editor)也将在 Chromebook Plus 上可用,该功能此前已登陆部分老款安卓设备。
2024年5月28日·周二
OpenAI宣布成立安全保障委员会并启动旗舰新模型训练
美国当地时间周一,人工智能初创公司OpenAI董事会在官网发文,宣布成立安全与保障委员会,以评估其人工智能模型的安全性和保障措施,这是在该公司负责该领域的高管辞职并且该公司有效解散了他的内部团队几周后进行的治理变革。安全与保障委员会的第一项任务将是在未来90天内评估和进一步发展OpenAI的流程和保障措施。在90天结束时,委员会将与全体董事会成员分享其建议。在全体董事会审查之后,OpenAI将以符合安全和保障的方式公开分享所采纳建议的最新情况。OpenAI也正式宣布,他们已经开始训练一款全新的旗舰级人工智能模型,这一模型将超越并接替目前驱动其在线聊天机器人ChatGPT的GPT-4技术。
百度沈抖:中国已有超半数央企联合百度进行AI创新
5月28日,2024智能经济论坛在北京举行。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖介绍了文心系列主力大模型免费背后的原因。此外,为了加速行业大模型的落地,百度智能云推出“千帆·行业增强版”,目前已经在政务、交通、工业等行业落地。目前,文心大模型已经拥有中国最大的产业落地规模,超半数央企正在联合百度进行AI创新。
百度文心一言上架统信UOS应用商店
据“统信 UOS”官方公众号,由百度研发的人工智能大语言模型产品文心一言正式上架统信应用商店,用户可通过统信应用商店一键下载、安装并使用文心一言。UOS AI 已在今年 1 月上架统信 UOS 桌面平台,该 AI 兼容云侧与端侧大模型,支持接入私有化部署的本地模型,统信 UOS 专业版 V20(1030 及以上版本)的用户可直接前往统信应用商店下载使用。
小度推出全球首款基于文心大模型的学习机Z30,售价6699元
日前,小度科技推出全球首款基于文心大模型的学习机——小度学习机Z30,售价6699元。小度学习机Z30搭载全球首款百度文心大模型“AI老师”。基于文心知识增强的大模型,“AI老师”同时掌握通用知识和专业知识,具有多模态感知、互动、拟人化呈现等特征,支持孩子进行自然语言多轮交互、随时提问,并能够定制学习计划。
今年一季度全球AI领域融资总额达1564亿,同比下降31.2%
市场研究机构PitchBook日前发布2024年Q1全球人工智能(AI)与机器学习领域的最新投融资数据报告。报告显示,2024年第一季度(1-3月),全球AI领域共计完成1779笔融资交易,筹集的风险投资总额高达216亿美元(约合人民币1564.27亿元),交易价值环比下降7.8%,同比下降31.2%。
2024年5月27日·周一
摩根士丹利报告称 AI PC 到 2028 年将占据超六成市场份额
摩根士丹利认为,人工智能个人电脑(AI PC)将开创一个新时代,并可能引发商用个人电脑的更新。大摩预计,AI PC的市场份额将逐年递增,到2028年将占据64%的份额。更多的企业首席信息官正在评估或计划评估AI PC的商用价值。
马斯克xAI官宣B轮融资60亿美元,估值约180亿美元
马斯克旗下的大模型创企xAI官宣拿到60亿美元(折合约435亿人民币)B轮融资,估值达到约180亿美元(折合约1304亿人民币),一举跃升独角兽。本轮融资的主要投资者包括特斯拉和SpaceX的首批投资者安东尼奥·格拉西亚斯(Antonio Gracias)领导的Valor Equity Partners、迪拜投资公司Vy Capital、美国私人风投Andreessen Horowitz、Sequoia Capital、风投公司Fidelity Management&Research Company、沙特王国控股公司Kingdom Holding等。
ChatGPT 开启 macOS 公测版本下载:快捷键启动、支持识屏答疑
ChatGPT 已开启 macOS 公测版本下载。OpenAI 于 5 月 14 日官宣推出 macOS 端应用,并计划在今年晚些时候推出 Windows 版。桌面端的 ChatGPT 应用拥有经过优化的用户界面,用户可以将处于最小化窗口的 ChatGPT 桌面应用与其他程序并排打开。用户可以通过输入或语音的方式向 ChatGPT 提问屏幕上显示的内容,ChatGPT 则能根据其“所见” 进行回答。
昆仑万维宣布天工AI每日活跃用户(DAU)超过100万
昆仑万维集团宣布,天工AI每日活跃用户(DAU)已超过100万,受到广大用户的热情追捧。根据国内商业智能数据服务商QuestMobile数据,早在2024年3月,昆仑万维天工AI APP的月活跃用户已达近千万,仅次于豆包与文心一言,成为国内AIGC APP月活跃用户第三。
美国众议院新法案将限制大模型出口和中国人在美从事AI相关工作
5月8号,美国众议院提交了“增强关键出口海外限制国家框架“法案(Enhancing National Frameworks for Overseas Restriction of Critical Exports Act,简称“ENFORCE Act”)。5月23日,美国众议院外交事务委员会(House Foreign Affairs)投票以43票赞成、3票反对的结果首轮通过了该法案。简单来说,法案将为美国政府对AI技术的出口管理打开“方便之门”,特别是OpenAI、微软、Anthropic、谷歌、Meta的AI模型出口管理。不仅如此,法案将限制相关人员对美国国家安全至关重要的新兴和基础技术的特定活动,也就是说,中国人的H1b holder需要特殊许可才能在美国从事AI/ML相关工作。
摩尔线程 / 无问芯穹“千卡集群”行业内首次实现国产 GPU 端到端 AI 大模型实训
摩尔线程、无问芯穹今天联合宣布,双方已经正式完成基于国产全功能 GPU 千卡集群的 3B 规模大模型“MT-infini-3B”实训,该模型基于摩尔线程国产全功能 GPU MTT S4000 组成的千卡集群,以及无问芯穹的 AIStudio PaaS 平台打造。
曝苹果与OpenAI已达成正式协议,iOS 18将引入ChatGPT
据媒体报道,马克·古尔曼(Mark Gurman)爆料,苹果已经与OpenAI签署了协议,确认将在iOS 18操作系统中引入ChatGPT的聊天机器人功能。这一消息预计将成为苹果6月份全球开发者大会(WWDC)的亮点之一。古尔曼在其Power On新闻通讯中透露,尽管苹果与OpenAI达成了合作,但苹果对于云AI服务的选择仍然持开放态度。
软银寻求每年90亿美元的AI投资,同时寻求更大的交易
软银正在为实现可能是其迄今最激进的转型而保留更大交易的实力,但仍准备每年投入近90亿美元用于人工智能投资。软银首席财务官表示,希望加大对人工智能公司的投资,但他拒绝就有关Arm和软银正在考虑生产人工智能芯片的媒体报道发表评论。
2024年5月26日·周日
马斯克计划打造10万颗芯片的xAI超算工厂,最快2025年运行
据The Information报道,马斯克日前向投资者确认,xAI计划将多达 10 万个专用训练芯片串联成一台大型计算机——或者他所说的“超级计算工厂”,预计2025年秋季之前投入运行。马斯克强调,此次交付完成后,连接在一起的芯片组(英伟达的旗舰 H100 GPU)将至少是当今最大的 GPU 集群的四倍,例如 Meta Platforms 为训练其 AI 模型而构建的 GPU 集群。
除马斯克 xAI 外,消息称 Meta 也在尝试与 Character.ai 进行合作
英国金融时报称,Meta 最近与聊天机器人初创公司 Character.ai 就合作进行了讨论。此外,马斯克旗下人工智能公司 xAI 也与 Character. ai 就合作关系进行了谈判,但目前为止尚未达成任何协议。知情人士透露,Character.ai 可利用大语言模型生成不同人物和角色的对话风格,Meta 与之讨论了研究人员在预训练和模型开发等项目上的合作。
2024年5月25日·周六
中国电信 AI 研究院发布“星辰”超多方言语音识别大模型,支持 30 种方言混说
中国电信人工智能研究院(TeleAI)日前宣布发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。据介绍,该模型可打破单一模型只能识别特定单一方言的困境,支持同时识别理解粤语、上海话、四川话、温州话等 30 多种方言,是国内支持最多方言的语音识别大模型。
研究称 ChatGPT 回答的编程问题错误率 52%,但 39% 人类程序员没看出来
来自普渡大学的研究小组于 5 月初出席计算机-人交互大会,并提交了一份报告,检查了 ChatGPT 回答的 517 个 Stack Overflow 问题,发现错误率高达 52%。调查结果显示,人类程序员在 35% 的情况下更喜欢 ChatGPT 的答案,认为其提供的内容更全面,且有清晰的语言风格;更糟糕的是,在 39% 的情况下,人类程序员并没有发现 ChatGPT 的错误答案。
淘宝推出“天猫AI讲价小助手”,可帮助用户购物砍价
淘宝最新宣布,已经在APP内推出了“天猫AI讲价小助手”,官方称希望帮助大家在618期间尽可能买到更物美价廉的宝贝。同时,淘宝宣布开启征名活动,希望广大网友给它取个名字。据介绍,用户打开天猫APP后,在购物车界面点击右下方“找优惠”,随后就能看到“帮讲价”入口。点击进入后,用户可以自行选择讲价商品。该功能需要使用用户的淘宝消息账号跟商家讲价。目前这个助手的功能还比较简单,会自动发送“我在其他店铺看到同款商品价格比较便宜,是否能考虑给一个更好的价格(或赠品)”、“如果能优惠,会给五星好评”、“这个商品看起来很不错,我很感兴趣”等信息。预计后续还会实现更高级的话术,能够一键获取最低价和优惠券。
谷歌回应新AI搜索综述引发互联网吐槽事件
在上周的年度I/O开发者大会中,谷歌高调宣布正式将AI功能引入核心搜索业务,推出一款名叫“AI概览”(AI Overviews)功能,首先会在美国市场推出。简而言之,当用户进行搜索时,首先出现在眼前的不再是网页链接,而是一块由AI整理的摘要。然而,这项功能一上线就“翻车”了——除了AI聊天机器人常见的“幻觉”外,更严重的问题是,谷歌的AI频频把“贴吧”、讽刺新闻网站里的玩笑话,当作正儿八经的知识普及给用户(如给披萨浇点胶水、建议网友吃石头)。谷歌回应称互联网上提到的错误来自于“非常罕见的那类查询”,并不代表大多数人的体验。公司已经采取行动打击违反政策的行为,同时正在利用这些“孤例”继续完善产品。
2024年5月24日·周五
估值有望超 240 亿美元,消息称马斯克 xAI 公司下月完成一轮融资
据彭博社援引知情人士透露,马斯克的人工智能公司 xAI 将于 6 月完成一轮融资,融资后估值可能超过 240 亿美元。报道称,该公司原定于本月早些时候完成约 60 亿美元的融资,但自去年以来一直在进行的交易尚未最终完成。这位要求匿名的人士表示,xAI 最近一直在寻求高达 65 亿美元的资金,并计划在未来几周内更接近这一目标。
Meta 将推出付费版聊天机器人Meta AI,今年或投入400亿美元用于AI技术研发
据媒体报道称,Facebook和Instagram的母公司Meta Platforms正在考虑向用户收取更高级版本的人工智能助手费用,该助手被称为Meta AI。谷歌、微软、OpenAI和Anthropic通过其聊天机器人收取每月20美元的订阅费。订阅后,人们可以在微软 Word 等工作场所应用中使用这些公司的聊天机器人,并在使用率高时获得优先访问权等。目前尚无法得知 Meta 高级版可能提供的功能,以及 Meta 可能收取的费用。
OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺
5 月 21 日,图灵奖得主 Yoshua Bengio、Geoffrey Hinton 和姚期智联合国内外数十位业内专家和学者,在权威科学期刊 Science 上刊文,呼吁世界各国领导人针对 AI 风险采取更有力的行动,并警告说,“近六个月所取得的进展还不够”。他们认为,AI 的无节制发展很有可能最终导致生命和生物圈的大规模损失,以及人类的边缘化或灭绝。
马斯克:AI是我最恐惧的事,它将取代人类所有工作
今天凌晨,特斯拉CEO马斯克(Elon Musk)通过视频连线参加在法国巴黎举办的“欧洲科技创新展览会”(VivaTech 2024),主要谈 AI、电动车等相关话题。马斯克表示,AI 技术是他最大的恐惧。他引用伊恩·班克斯(Ian Banks)的“文化丛书”(Culture Book Series)——是对一个由先进技术驱动的社会的乌托邦式虚构,是最现实,也是“对未来人工智能的最佳设想”。马斯克强调,未来有一天,AI 将取代我们所有的工作,这不一定是一件坏事。
马斯克承认Grok不如ChatGPT,但今年能赶上
当地时间周四,马斯克在巴黎举行的VivaTech大会上发表视频讲话并接受远程采访,谈到了人工智能、太空探索和社交媒体等一系列话题。马斯克说,他的人工智能初创公司xAI的聊天机器人Grok将“尽最大努力做到严谨,追求真相,做到最有趣。如果我们终将死去,我们最好是笑着死去。”但他承认,在Grok能与OpenAI或谷歌的Gemini竞争之前,还有“很多追赶要做”。他说,这可能在今年年底前实现。
谷歌和Meta据称出价数千万美元与好莱坞合作
据知情人士透露,谷歌母公司Alphabet Inc.和Meta Platforms Inc.已与好莱坞主要电影公司进行了讨论,希望电影公司能授权IP内容用于这两家科技巨头的人工智能视频生成软件。据悉,两家公司都在开发能够根据文本提示创建逼真场景的技术,并提供了数千万美元的资金与电影公司合作。此外,微软支持的竞争对手OpenAI也在进行类似的对话。
阿里披露投资 Kimi AI 开发商月之暗面:8 亿美元购入约 36% 股权
据阿里巴巴财报披露,该公司于 2024 财年向 Kimi智能助手 的开发公司月之暗面(Moonshot AI)投资合共约 8 亿美元,购入约 36% 股权,为于月之暗面的优先股投资。阿里巴巴集团主席蔡崇信和首席执行官吴泳铭在股东信中写道,该公司“将 AI 作为改变和加速业务增长的最强大变量”。
前 OpenAI 华人工程师创办的 AI 独角兽 Adept 或考虑出售给 Meta
根据 The Information 最新消息,Adept 近几个月来一直在讨论出售或与大型科技公司建立战略合作伙伴关系的可能性,与之交谈过公司包括 Meta。上周,就在 OpenAI 发布 GPT-4o 不久,Adept 创始人&CEO David Luan 还与投资者 Greylock 合伙人 Seth Rosenberg 展开对话,后者还发文力挺。
AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力
据36氪从多个独立信源处获悉,字节跳动大语言模型研发技术专家杨红霞,已于近日从字节跳动离职,并开始筹备AI创业项目。杨红霞曾担任阿里达摩院超大规模多模态预训练模型M6的技术负责人,后加入字节AML(Applied Machine Learning,机器学习系统)团队。
2024年5月23日·周四
智驾公司鉴智机器人获 3000 万美元新融资,亦庄国投领投、地平线跟投
智能驾驶公司鉴智机器人近日完成了 3000 万美元的 Pre-B 轮融资,由北京经开区产业升级基金及北京智能网联汽车产业基金联合领投,二者都是亦庄国投管理的投资基金;此轮跟投的鉴智老股东中,则有智能驾驶计算平台公司地平线。鉴智是目前中国市场仅有的两家可基于双目摄像头做纯视觉方案的智驾供应商,另一家是大疆。
英伟达称一年推出一款芯片,Blackwell下一代已在准备中
英伟达首席执行官黄仁勋在财报电话会议上指出,继Blackwell之后,英伟达正在开发一款新芯片,节奏是一年发布一次。此前英伟达的芯片设计频率稳定在两年一次,从一开始2020年发布的Ampere,到2022年的业界宠儿H100芯片(Hopper系列),再到2024年备受期待的Blackwell。但显然,两年对于英伟达来说似乎是太久了。本月早些时候,知名分析师郭明錤就透露,英伟达的下一代AI芯片架构Rubin将于2025年问世,最早明年市场就能获得R100 AI GPU。
OpenAI 和新闻集团签署多年协议,ChatGPT 可引用《华尔街日报》等媒体内容
OpenAI 公司宣布和新闻集团(News Corp)签署多年协议,意味着 ChatGPT 等相关产品可以引用该集团的相关内容。OpenAI 将获得新闻集团主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》、《巴伦周刊》、《市场观察》、《投资者商业日报》、《FN》和《纽约邮报》;《泰晤士报》、《星期日泰晤士报》和《太阳报》;《澳大利亚人报》、news.com.au、《每日电讯报》、《信使邮报》、《广告人报》和《先驱太阳报》等。
Meta成立“AI产品咨询顾问委员会”,由四大科技高管组成
据报道,Meta平台首席执行官扎克伯格创立了一个新的人工智能(AI)产品咨询顾问委员会,他们将定期与Meta管理团队会面,并提供人工智能和先进技术层面的指导。据悉,该委员会将由四名高管组成:网络支付服务提供商Stripe首席执行官兼联合创始人Patrick Collison、线上软体原始码代管服务平台GitHub前首席执行官Nat Friedman、跨国电子商务公司Shopify首席执行官Tobi Lütke和前微软高管Charlie Songhurst组成。
亚马逊与 Hugging Face 合作:定制芯片低成本运行 AI 模型
亚马逊公司的云部门宣布,已与人工智能初创公司 Hugging Face 合作,将在亚马逊的定制计算芯片上更低成本地运行数千个 AI 模型。估值 45 亿美元的 Hugging Face 已成为 AI 研究人员和开发者分享聊天机器人或其他 AI 软件的中心,并得到了亚马逊、Alphabet 旗下的谷歌和英伟达等公司的支持,它是开发者获取和调整开源 AI 模型(如 Meta Platforms 的 Llama 3)的主要平台。
李彦宏称自己是AI的长期信仰者:十多年前就开始投入研发
百度创始人、董事长兼首席执行官李彦宏在法国巴黎“欧洲科技创新展览会”(Viva Technology)上表示,自己是中国人工智能的长期信仰者,并透露百度在十多年前就开始积极投入人工智能的研发工作。李彦宏回顾了自己30多年前上大学时就已学习了人工智能课程,并意识到AI是解决搜索问题的核心技术。因此,百度在十多年前就开始了对人工智能技术的研发,尤其是与自然语言处理相关的领域。他提到,百度于2019年推出了具有1亿参数规模的文心大模型1.0版本。
亚马逊据称正计划全面升级改造Alexa语音助手
据媒体报道,知情人士透露,美国科技巨头亚马逊公司正在使用生成式人工智能升级其智能语音助手Alexa,并计划向用户每月收取订阅费,以支付该技术的成本。据了解,Alexa已经有十年历史。两位知情人士称,亚马逊将推出更具对话性的版本,令其能与谷歌、OpenAI的竞品展开竞争。一位消息人士称,每年139美元的Prime会员年费将不会包含Alexa的订阅费用。
黄仁勋最新访谈:英伟达已离不开AI,AGI或五年内出现
在近期举办的Stripe Sessions用户大会上,移动支付巨头Stripe的联合创始人兼CEO帕特里克·克里森(Patrick Collison),与英伟达CEO黄仁勋进行了一场炉边对话。对于人工智能的未来,黄仁勋表示出了极大的信心。他预测人工智能将在未来高速发展,并强调英伟达在未来五年将大力运用人工智能来推动GPU的生产与创新。此外,黄仁勋还提到了英伟达的核心价值观之一——“爱与关怀”。他认为这与Stripe所倡导的“美与技艺”价值观有着异曲同工之妙,都体现了对于卓越品质的不懈追求和对于用户的深切关怀。
2024年5月22日·周三
微软Build开发者大会发布50+产品更新,Altman压轴预告新模型
5月22日凌晨,微软 Build 2024 开发者大会今晨在美国西雅图召开,微软一口气发布了 50 多项更新,带来从 AI 基础设施的搭建,到模型产品的落地方向的工具和生产力工具。作为接棒 OpenAI 和Google发布会,微软不仅要和苹果等厂商争夺 AI PC 的定义权,誓要“颠覆”10亿打工人的Copilot,全新加持Agent。OpenAI CEO奥特曼(Sam Altman)压轴登场,谈及新模型时,奥特曼表示,新的模态和整体智能将是OpenAI下一个模型的关键。他预计模型将会变得更智能、更强大,更安全,而且GPT-4o将会速度更快,成本更低。
腾讯混元大模型全面降价,混元-lite 即日起免费
今天,腾讯云公布全新大模型价格方案,其中主力模型之一混元-lite 模型,API 输入输出总长度计划从目前的 4k 升级到 256k,价格从 0.008 元 / 千 tokens 调整为全面免费。最高配置万亿参数模型混元-pro,API 输入价格从 0.1 元 / 千 tokens 降至 0.03 元 / 千 tokens,降幅达 70%。
百川智能发布Baichuan 4及首款AI智能助手百小应
百川智能发布最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“ 百小应 ”。Baichuan 4相较Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一。
腾讯云正式对外宣布旗下AI代码助手全面对外开放
腾讯云AI代码助手已全面对外开放。开发者、开发团队以及企业客户现在可以通过访问腾讯云官网在线体验该服务。据了解,腾讯云AI代码助手是一款定位代码智能补全和生成的数字化工具,它基于腾讯混元代码模型,可以为开发者、开发团队及企业客户提供安全合规、高粘度体验的编码场景AIGC服务,具备代码补全、技术对话、代码诊断、单元测试等功能,支持 Python、Java、C/C++、Go等数十种编程语言或框架,以及VS Code、JetBrains 等主流集成开发环境。
谷歌宣布已开始在AI搜索结果中加入购物广告
谷歌近日宣布,已开始在其人工智能搜索结果中加入购物广告,这一新举措将率先在美国地区实施。谷歌表示,这些广告内容会明确标识为“广告”,并且仅在广告商提供的“提示词”与用户搜索的“提示词”相匹配时才会展示。谷歌新上任的搜索主管Liz Reid提出,通过小规模测试发现,用户乐于在AI概述上/下方看到广告信息,因为这些信息对他们来说“很有帮助”。
讯飞星火 Lite API 能力免费开放:在线联网搜索、低算力推理场景
科大讯飞今日官宣,旗下讯飞星火 Lite API 永久免费开放,支持在线联网搜索、适用于低算力推理与模型精调等定制化场景。据介绍,1token 相当于 1.5 个中文汉字,用户付费 0.21 元即可调用“讯飞星火 3.5 Max”生成一部“余华《活着》”的内容量。
微软发布多模态小模型 Phi-3-vision,拥有42亿参数
微软在首次宣布发布其 Phi-3 轻量级AI模型系列一个月后,正式向开发者开放。Phi-3系列包含三种规模的模型:Phi-3-mini(38亿参数)、Phi-3-small(70亿参数)和Phi-3-medium(140亿参数)。其中Phi-3-mini已被纳入Azure AI平台。微软还特别推出了Phi-3-vision,这是一款具有42亿参数的多模态小模型变种,能够支持通用视觉推理任务以及图表、图形和表格的推理。
微软与可汗学院合作,将为美国所有教师提供免费AI助手
美东时间周二,美国科技巨头微软与教育辅导机构可汗学院达成合作,将向美国所有教师免费提供生成式人工智能(AI)助手。据介绍,从周二开始,AI学习辅助工具“Khanmigo for Teachers”将对所有美国教师开放,它可以帮助教师创建课程、分析学生表现、规划作业,并为教师提供提高自身学习能力和教学效率的机会。
微软CEO纳德拉:Azure AI Studio现已支持提供GPT-4o API
5月22日凌晨,微软Build 2024开发者大会于在美国西雅图召开,据微软公司CEO、董事长萨提亚·纳德拉介绍,由OpeanAI开发的最新旗舰模型 GPT-4o ,现已在Azure AI Studio中提供,并作为API提供。该多模态模型集成了文本、图像和音频处理能力,带来了全新的生成式和对话式AI体验。
亚马逊暂停订购英伟达Hopper芯片,投资者担心需求中断
据报道,亚马逊旗下云计算部门AWS已暂停订购英伟达最先进的“超级芯片”Grace Hopper,以等待功能更强大的新产品Grace Blackwell(GH200)。此举正值投资者担心,英伟达将在两个产品周期之间出现需求下滑。今年3月,英伟达发布了名为Blackwell的新一代处理器,距离其前身Hopper开始向客户发货不到一年。英伟达CEO黄仁勋表示,新产品在训练大型语言模型方面的能力将提高一倍。
Adobe Lightroom 引入新 AI 功能,可一键移除照片中的物体
作为其开发更多人工智能工具计划的一部分,Adobe 宣布了即将登陆其照片编辑软件 Lightroom 的全新人工智能功能。Adobe 宣布了两项全新的人工智能功能:生成式消除 (Generative Remove) 和镜头模糊预设 (Lens Blur presets)。生成式消除功能由 Adobe 的人工智能图像生成器“Firefly” 提供支持。使用该功能,用户可以选择照片中不需要的部分,Lightroom 将自动将其移除。
2024年5月21日·周二
欧盟理事会正式批准《人工智能法案》
当地时间21日,欧盟理事会正式批准《人工智能法案》。该法案在经欧洲议会和欧洲理事会主席签署后,将于近日在欧盟官方公报上公布,并在公布20天后生效。今年3月13日,欧洲议会以523票赞成、46票反对和49票弃权的表决结果通过了该法案。
IBM 宣布将开源更多人工智能模型
5月21日,IBM宣布,将以开源软件的形式发布一系列人工智能模型。IBM称,在watsonx平台推出一年后,该平台将进行多项新的更新,并即将推出数据和自动化功能,旨在使人工智能对企业而言更加开放、更具成本效益和灵活性。
OpenAI投资者Alpha Intelligence Capital筹集2.5亿美元新基金,聚焦AI投资
OpenAI等人工智能公司的投资者Alpha Intelligence Capital(AIC)正在筹集一只规模达2.5亿美元的基金,并吸引到了法国和新加坡的政府实体作为投资者。AIC合伙人Arnaud Barthelemy和Terry Chou表示,已为该基金筹集到1.6亿美元资金,并有望在9月前完成最终募资。他们补充称,法国兴业银行和新加坡一家国有基金将参与其中。一位知情人士透露称,新加坡主权财富基金淡马锡是这只新基金的投资者之一。
李开复:中美AI大模型差距已从10年,缩短到落后6个月,而国内算力一直远远落后
今早谈到中美大模型差距,李开复对钛媒体表示,如果只评估千亿模型,零一万物是世界第一的。在一年前,我们(中国)落后OpenAI、Google 7-10年,现在,“我觉得差距也就是在6个月左右”,大大降低了。但李开复也强调,目前国内算力差距也是重要课题,“我们算力一直远远落后”。但随着推理算力成本下降,他相信基于更低的算力成本也能做出更好的模型。
LMSYS榜单更新,零一万物Yi-Large位居中文榜第一、总榜第七
大模型竞技场LMSYS榜单今天突然更新:国内大模型公司零一万物旗下的Yi-Large千亿参数闭源大模型,跃升总榜第七,也成为榜上国产大模型第一。可以看到,它的成绩几乎与GPT-4-0125-preview持平。同时,国内清华系大模型公司智谱华章的GLM-4-0116也杀进总榜,位居第15位。这个结果来自累积超1170万全球用户的真实盲测投票数。而且大模型竞技场最近修改了规则,只要大模型亮明身份后就不能再继续投票,杜绝了刷分的可能性。再来看Yi-Large排名之前的前6名中,有4个模型来自GPT,另外有1个谷歌的Gemini,1个Anthropic的Claude。
百度文心大模型 ENIRE Speed、ENIRE Lite 即日起免费调用
字节跳动上周发布了豆包大模型并宣布大模型价格进入“厘时代”,号称“比行业便宜 99.3%”。今日,阿里云也宣布通义千问 Qwen-Long 降价 97% 来应战。现在,百度文心大模型更进一步,直接宣布其两款主力模型 ENIRE Speed、ENIRE Lite 全面免费,即刻生效。
阿里云宣布通义千问9款主力模型全面降价,最高降价97%
阿里云官微宣布,通义千问商业化模型和开源模型今日起降价。其中,通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。简单来说,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400。
美国演员斯嘉丽·约翰逊称OpenAI未经同意刻意模仿其声音
上周,OpenAI最新发布的产品 GPT-4o 引发外界极大关注,其默认语音之一 “Sky” 因其声音酷似电影《她》中扮演智能语音助手的约翰逊声音而成为头条新闻。约翰逊在5月20日的声明中说,OpenAI首席执行官山姆·奥特曼(Sam Altman)曾在去年9月找到她,询问她是否愿意为ChatGPT配音,并表示他觉得这会“安慰那些”对这项技术感到不自在的人。经过深思熟虑和个人原因,她拒绝了OpenAI的邀请。日前,OpenAI在社交平台上发表声明表示,将暂停使用Sky声音。
微软宣布AI电脑升级,GPT-4o 将很快加持
Copilot 本周二举行Build年度全球开发者大会前,微软先举行了重磅新品发布会。继3月首次推出将人工智能(AI)功能结合到个人电脑(PC)的首批AI PC后,微软又将旗下AI助手Copilot全面融入Windows系统。Nadella宣布,微软的新PC将是“Copilot+PC”,称它们是“有史以来速度最快、最适合AI的 PC”。此外,上周OpenAI刚推出的最新技术GPT-4o将很快作为微软Copilot的一部分提供给用户。
微软推出 Recall 功能:可记住 Windows 用户所有交互
在今日微软公司新园区举行的特别活动中,推出了专为AI体验设计的全新Windows PC品类:Windows 11 AI PC。Windows 11 AI PC搭载了创新的”回顾”(Recall)功能,让电脑具备了前所未有的“记忆”能力,能够记住用户所有的交互行为。Recall功能是微软在Build开发者前瞻大会中推出的Windows 11全新工具,它能够记录用户在电脑上看到和做过的所有事情,并允许用户搜索和检索在设备上的任何操作。
腾讯计划投资月之暗面,杨植麟最新发言:今天人类对AI信任还不够
据钛媒体报道,腾讯公司正考虑投资大模型初创公司月之暗面(Moonshot AI),从而为腾讯与 Kimi智能助手 之间更深层次合作铺平道路。值得一提的是,在此之前,月之暗面已从阿里集团获得10亿元融资,一旦上述融资完成,月之暗面将成为国内 AI 领域单轮融资额最高、唯一获得阿里与腾讯两家巨头投资的大模型公司。目前,月之暗面下轮投前估值已达到30亿美金。
OpenAI GPT-4o 推动 ChatGPT 订阅服务需求激增,移动端营收暴涨
据应用情报公司 Appfigures 的数据显示,在 GPT-4o 发布当天,ChatGPT 移动应用的净收入就暴增了 22%,并且在接下来的几天里持续增长。到周二,净收入达到了 90 万美元(当前约 650.7 万元人民币),几乎是其日常平均水平(49.1 万美元)的两倍(净收入数据是在苹果和谷歌商店抽成后计算所得)。
2024年5月20日·周一
知名爆料人古尔曼锐评苹果:iPad与Mac区分错误、AI战略需重大改变
知名爆料人马克·古尔曼(Mark Gurman)近日对苹果公司在人工智能时代的表现发表了自己的评论。古尔曼认为,苹果在生成式人工智能竞赛中表现不佳,需要改变策略以迎头赶上。他指出,必须在人工智能领域后来居上并取得胜利,是库克在任期内的最大挑战。他认为苹果的主要优势在于其资金、人才和强大的平台,但古尔曼强调,苹果需要对其战略做出重大改变。
消息称苹果首席运营官威廉姆斯访问台积电,探讨 AI 芯片开发
台媒《经济日报》消息,苹果公司首席运营官杰夫・威廉姆斯(Jeff Williams)低调拜访台积电,台积电总裁魏哲家亲自接待。双方主要讨论了苹果自研 AI 芯片的开发,以及台积电使用先进制程技术生产芯片等事宜。
微软将于本周二召开Build开发者大会,或将展示其最新的AI项目
微软的Build开发者大会将于周二开幕,让该公司有机会展示其最新的人工智能(AI)项目。本月早些时候,OpenAI和谷歌已举办了备受瞩目的人工智能活动。在人工智能竞赛中,微软比其他公司有明显优势的一个领域是它拥有Windows系统,这让该公司拥有庞大的PC用户群。微软首席执行官Satya Nadella今年1月表示,2024年将标志着人工智能成为“每台个人电脑的一流部件”。
2024年5月19日·周日
月之暗面推出“给Kimi加油”付费选项,可获得高峰期优先使用权益
月之暗面 Kimi 智能助手现已上线“给 Kimi 加油”付费选项,可获得高峰期优先使用权益。目前只有电脑网页端可以支付支持,提供以下六种档位:送 Kimi 一朵花:5.2 元 / 4 天;给 Kimi 加鸡腿:9.99 元 / 8 天;请 Kimi 喝咖啡:28.8 元 / 23 天;给 Kimi 充充电:49.9 元 / 40 天;请 Kimi 吃顿饭:99.0 元 / 93 天;和 Kimi 一起登月:399 元 / 365 天。
OpenAI Altman 回应“封嘴”离职条款:从未回收过任何员工股权
OpenAI 首席执行官阿尔特曼在 X (推特)上就此前“封嘴”离职条款传闻进行回应:公司从来没有收回任何人的既得股权,哪怕人们没有签署离职协议(或不同意非贬低协议),也不会采取上述做法。在 OpenAI 此前的离职文件中,有一项关于潜在的“收回股权”的条款,但阿尔特曼称该条款并未实际执行过,且“不应出现”在任何文件或沟通之中。
a16z风投创始人对谈AI:重大技术创新总会伴随着投机和泡沫
美国风险投资公司a16z日前在视频平台Youtube上发布了联合创始人马克·安德森(Marc Andreessen)和本·霍洛维茨(Ben Horowitz)拍摄的视频。在这段对话视频中,安德森与霍洛维茨探讨了面对大型科技公司拥有了算力和数据规模优势,小型人工智能初创公司如何与之竞争;揭示了数据作为可出售资产被高估的原因;以及人工智能热潮与本世纪初互联网浪潮的异同之处。
2024年5月18日·周六
原超级对齐负责人批评OpenAI追求华而不实的产品,忽视AGI安全
OpenAI 前安全总监,超级对齐团队负责人 Jan Leike 在宣布从 OpenAI 辞职后首次发声。Jan Leike 称在过去几个月里其团队难以获得足够的计算资源,使得开展安全研究变得越来越困难。他认为 OpenAI 亟需弄清如何驾驭和控制比我们更智能的人工智能系统,OpenAI肩负全人类的沉重责任,应该将更多精力集中在为下一代模型做好准备、安全性、监控、防患于未然、安全性、对抗性鲁棒性、(超级)对齐、保密性、社会影响以及相关主题上。但在过去几年里,安全文化和流程都让位于华而不实的产品。
OpenAI解散了由前首席科学家Ilya领导的超级对齐AI风险团队
本周五,OpenAI证实,由Ilya和他的亲信Jan Leike共同领导的“超级智能对齐团队”已经解散。此后,该团队的研究工作将被整合到OpenAI的其他研究小组中。马斯克评价称:“这显示安全并不是OpenAI的首要任务。”Jan Leike周五在X上公开透露了他离职的部分原因。他的潜台词是,他与OpenAI高层在公司的核心优先事项上存在长期分歧,最终双方的分歧已经严重到无法调和的地步。团队在推动其研究项目和争取计算资源时遇到了重大阻碍,缺乏资源会严重影响研究的进度和质量。
智源研究院推出智源评测体系,发布国内外140余个大模型评估结果
5月17日,智源研究院举办大模型评测发布会,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。智源研究院在测评中引入海淀区教师进修学校新编小学三年级至高三学段,覆盖语数英物化史6个学科,总计45套试卷,1400道试题。综合各年级、各学科综合得分率,表现优异的前五名都是闭源大模型,分别是通义Qwen-vl-max、百度文心一言4.0、智谱华章GLM-4、百川智能Baichuan3、GPT-4。然而,在学科测验上,大模型略低于海淀各年级学生平均水平。
德勤:亚太地区使用生成式 AI 的员工每周可节省 6.3 小时工作时间
德勤 Deloitte 日前发布了最新报告《亚太地区生成式 AI 应用现状:新生代员工处于领先,雇主需迎头赶上》,调查访问了亚太地区逾 11900 名受访者,发现 AI 新生代在节省工作时间(使用生成式 AI 的员工每周可节省近一天的工作时间<6.3 小时>)、拓展新兴技能、缓解工作负荷和提升生产力等方面均处于领先。
英国监管机构将不会调查微软与 Mistral AI 的合作关系
微软公司与人工智能公司 Mistral AI 的合作案将免于英国反垄断调查。英国竞争与市场管理局(CMA)5 月 17 日发布声明称,裁定微软与 Mistral AI 的合作伙伴关系不符合英国《2002 年企业法》合并条款下的调查资格。
2024年5月17日·周五
腾讯称混元大模型部分中文能力已追平GPT-4,支持16秒视频生成
腾讯集团副总裁蒋杰在腾讯云生成式AI产业应用峰会上表示, 腾讯混元大模型 通过持续迭代,目前整体性能已居国内第一梯队,部分中文能力已追平GPT-4。自OpenAI的 Sora 发布以来,AI生成视频备受关注。据介绍腾讯混元同样支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持16s视频生成。在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。
OpenAI 增强 ChatGPT 数据分析能力,用户可实时交互式快速分析数据
OpenAI宣布未来几周内,其新旗舰AI模型 GPT-4o 将为ChatGPT Plus、Team和Enterprise用户提供数据分析增强功能,并放出4个演示视频。无论是大型数据集合并、数据分析、创建图表、挖掘数据信息,都能一句话召唤ChatGPT执行。只需上传一个或多个数据文件,用户就可以指挥ChatGPT分析或修改表格,回答关键数据信息,以及执行按月分组、更改数据精度等常见数据处理任务。
腾讯副总裁蒋杰:混元文生文大模型将在三季度开源
在腾讯生成式AI产业应用峰会上,腾讯副总裁、腾讯混元大模型负责人蒋杰透露称,将在今年三季度开源混元最核心的文生文模型。蒋杰称,腾讯内部正在训练三种尺寸(S、M、L)的文生文模型供开源使用,S版主要部署在手机端,拥有3B参数量;M版主要部署在PC端,参数量为5B;L版主要部署在云/数据中心,是30B参数量的MOE架构模型。
OpenAI 官宣与 Reddit 合作:实时引用贴文内容、改进文章理解方式
Reddit 和 OpenAI 今天发布新闻稿宣布建立“合作伙伴关系”,将 Reddit 的问答内容带入 OpenAI 旗下产品,而 OpenAI 也将成为 Reddit 的广告合作伙伴。OpenAI 将为 ChatGPT 和新产品带来 Reddit 问答内容,帮助用户“发现 Reddit 社区并与之互动”。
Snowflake 正洽谈以超 10 亿美元价格收购
Reka AI 有媒体援引知情人士透露的消息报道称,云数据仓库领域的领导者Snowflake正在谈判以逾10亿美元收购人工智能领域的初创公司Reka AI,进一步扩大这家软件提供商在生成式人工智能功能和应用方面的布局规模。通过此次收购,Snowflake有望整合Reka AI的先进AI模型和技术,全面增强其云数据仓库各项功能,为企业级客户提供更强大的“生成式AI+云数仓”服务。
索尼音乐警告人工智能公司停止利用其内容来训练模型
全球最大的唱片公司之一索尼音乐集团(Sony Music Group)警告人工智能公司和音乐流媒体平台,未经明确许可,不要使用该公司的内容来训练模型。索尼音乐向700多家公司发函,试图保护其知识产权,包括专辑封面、元数据、音乐作品和歌词,以免被用于训练人工智能模型。据悉,OpenAI、微软、谷歌、Suno和Udio等一众AI公司都收到了警告信。
世界最大开源 AI 社区 Hugging Face 将免费提供 1000 万美元共享 GPU
世界最大的开源 AI 社区 Hugging Face 日前宣布,将提供 1000 万美元的免费共享 GPU 帮助开发者创造新的 AI 技术。具体来看,Hugging Face 这次做出此举的目的是帮助小型开发者、研究人员和初创公司对抗大型 AI 公司,避免 AI 进步陷入“集中化”。
2024年5月16日·周四
vivo 看见 App 接入蓝心大模型,行业首发多模态大模型辅助视障人士
vivo 今日宣布,vivo 看见 App 全新升级,接入蓝心大模型,成为行业首款多模态大模型视觉辅助产品。在 vivo 应用商店搜索“vivo 看见”即可下载。vivo 看见支持实时语音播报,镜头对准周围环境和物品即自动播报画面内容及文字信息,还可切换到文字、卡证、条码等多种识别模式。定格画面后点击“对话”,即可与 vivo 看见进行多轮语音对话,轻松获取更多画面内的细节信息。
Stability AI 面临资金危机,或考虑出售
据 The Information 报道,英国 AI 初创公司Stability AI最近几周至少与一位潜在买家就出售问题进行了讨论。据悉,在2024年第一季度,Stability AI的营收不到500万美元,亏损超过3000万美元。此外,该公司目前拖欠云计算供应商和其他公司近1亿美元的账单。Stability AI 目前尚未对此消息进行回应。
魅族发布 Flyme AIOS,支持一键 AI 搜索、AI 接听等功能
在今天下午举行的魅族新品发布会上,全新 Flyme AIOS 率先登场。据介绍,全新 Flyme AIOS 已实现更多 AI 功能的开发,手机、AR 眼镜,甚至是未来车型,都将通过 AI 给用户带来全新的科技体验。该系统的 AI 功能包括连麦对话、AI网页总结、AI文档解读、AI搜索、拖拽流转、通话助理、AI全局录音、AI笔记创作、任务剧本等。
抖音试水AI电商,测试“AI购物小助手”
据Tech星球报道,抖音电商正在测试首款面向C端的AI电商服务“AI购物小助手”。据悉,该业务从去年下半年就开始已着手研发,由上海团队负责,期望能够打造服务亿级用户的AI明星产品,通过AI技术提升用户购买体验以及业务效率。去年年底进行过小范围测试,其算法推荐机制是基于云雀大模型算法。
IBM 将在爱尔兰增加 800 个人工智能相关岗位
爱尔兰国家投资机构IDA Ireland周四表示,IBM计划在爱尔兰增聘多达800人,以帮助打造以人工智能技术为基础的先进软件,这是爱尔兰跨国企业今年宣布的最大一桩招聘计划。
小米 AI 大模型 MiLM 正式通过备案,将逐步应用于汽车 / 手机 / 智能家居等产品
据“小米公司”官方微博,今天小米大语言模型 MiLM 正式通过大模型备案,相关模型据称将逐步应用于小米汽车、手机、智能家居等产品中,后续“将面向更多用户开放体验”。小米公司 MiLM 大模型在去年 8 月首度现身 C-Eval、CMMLU 大模型评测榜单,当时这款模型在 C-Eval 总榜单排名第 10、同参数量级排名第 1。
Anthropic 聘请 Instagram 联合创始人 Mike Krieger 为产品主管
Instagram联合创始人迈克-克里格(Mike Krieger)周三宣布,他将加入人工智能初创公司Anthropic担任首席产品官。Anthropic是Claude大模型和同名AI聊天机器人背后的开发公司。亚马逊对其总投资额达到40亿美元,是该公司30年历史上最大的一笔外部投资。克里格曾在Meta Platforms旗下Instagram担任首席技术官,在他任职期间内,该平台用户数量发展到10亿,工程师团队人数超过450人。克里格和Instagram的另一位联合创始人凯文-西斯特罗姆(Kevin Systrom)最近开发了一款个性化新闻应用Artifact,并将其卖给了雅虎。
苹果宣布推出全新辅助功能,包括眼动追踪、音乐触觉、人声快捷键
Apple(苹果)日前宣布将于今年晚些时候推出全新的辅助功能,包括眼动追踪,可以帮助残障用户通过眼动来使用 iPad 或 iPhone。此外,音乐触觉将为听觉受损用户提供在 iPhone 中使用触感引擎体验音乐的全新方式;人声快捷键让用户可以通过自定义声音来执行任务;当在移动的车辆中使用 iPhone 或 iPad 时,车辆运动提示(Vehicle Motion Cues)有助于减缓晕车;visionOS 将提供更多的无障碍功能。
美国参议院“AI政策路线图”出炉,或拨款至少320亿美元用于非国防AI
由美国参议院多数派领袖查克·舒默率领的参议院两党人工智能工作组(简称“AI工作组”)于当地时间周三发布了一份30余页的报告,在这份美国AI政策路线图中,工作组提出了大量的政策建议,主要集中在利用机遇(砸钱)鼓励创新,以及快速应对技术带来的风险。AI工作组鼓励美国政府和参议院拨款委员会,通过紧急拨款等手段,尽快达到美国人工智能安全委员会(NSCAI)提出的投入水平:每年在非国防领域至少投入320亿美元,用于推动跨政府部门的AI研发、支持基础科学研究,并对AI在先进制造、智能城市、合成化学&生物等广泛领域的应用提供支持。
2024年5月15日·周三
谷歌I/O大会发布十几款新品,提及 AI 121 次,最新长文本模型问鼎全球最强
北京时间5月15日凌晨,谷歌I/O开发者大会主题演讲上,谷歌CEO桑达尔·皮查伊(Sundar Pichai)发布数十款Google和 AI 结合产品,堪称“全家桶”级别,全力对战OpenAI。其中包括支持200万token长文本的Gemini 1.5 Pro和 Gemini 1.5 Flash、谷歌版Sora视频技术 Veo ,最强开源模型Gemma 2,支持生成式搜索的AI Overviews、第六代TPU等。但最受关注的,还是谷歌DeepMind CEO、谷歌 AI 负责人Demis Hassabis公布的真正通向 AGI 的万能助手项目Project Astra,以及语音NotebookLM,直接对标GPT-4o。这场110分钟演讲中,皮查伊提及 AI 的次数竟然高达121次(谷歌自己的统计)。
百度发布全球首个 L4 级自动驾驶大模型 Apollo ADFM
百度 Apollo 今天在武汉百度萝卜快跑汽车机器人智行谷举办 Apollo Day 2024,发布了全球首个支持 L4 级自动驾驶的大模型 Apollo ADFM(Autonomous Driving Foundation Model)。百度称,Apollo ADFM 基于大模型技术重构自动驾驶,可以兼顾技术的安全性和泛化性,做到安全性高于人类驾驶员 10 倍以上,实现城市级全域复杂场景覆盖。
OPPO、vivo、荣耀、小米、三星、华硕、字节跳动成立智能终端大模型联盟
在今日的字节跳动 2024 春季火山引擎 Force 原动力大会上,火山引擎与 OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。OPPO 小布助手、荣耀智慧办公智能助手、小米“小爱同学”,以及华硕笔记本电脑的豆叮 AI 助手等应用,均已接入火山引擎的大模型服务。
字节跳动发布豆包大模型,主力模型比行业价格低99.3%
字节跳动豆包大模型在火山引擎原动力大会上正式发布。豆包大模型原名“云雀”,是国内首批通过算法备案的大模型之一。基于豆包大模型,字节跳动打造了AI对话助手“ 豆包 ”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”,以及星绘、即梦等AI创作工具。豆包主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%
OpenAI 联合创始人兼首席科学家 Ilya Sutskever 宣布离职
OpenAI 联合创始人兼首席科学家 Ilya Sutskever 今早在 X 发布推文,正式宣布离开 OpenAI。Ilya Sutskever 为前 OpenAI 董事会成员,曾推动罢免 OpenAI CEO 阿尔特曼 Sam Altman 的行动。他表示“我对接下来的工作感到兴奋 —— 这个项目对我个人意义重大,我会在适当的时候与大家分享细节。”
2024年5月14日·周二
OpenAI推出新的AI模型GPT-4o和ChatGPT桌面端
OpenAI推出了新的人工智能模型 GPT-4o 和 ChatGPT 桌面版本,以及新的用户界面。技术负责人 Mira Murati 在直播活动中表示,此次更新将 GPT-4 带给所有人,包括 OpenAI 的免费用户。她补充说,新模型 GPT-4o“速度快得多”,文本、视频和音频功能也得到了改进。Murati 表示,新模型还提高了 50 种不同语言的 ChatGPT 的质量和速度,并且还将通过 OpenAI 的 API 提供,以便开发人员今天就可以开始使用新模型构建应用程序。 Murati 表示,GPT-4o 的速度是 GPT-4 Turbo 的两倍,成本却是 GPT-4 Turbo 的一半。
宇树科技发布 Unitree G1 人形机器人,售价 9.9 万元起
5月13日,宇树科技官方微信公众号发文 《Unitree G1 人形智能体 AI化身 ¥9.9万元起》 ,疑似宣布正式开卖售价不足六位数的人形机器人。同时,宇树科技还在视频平台B站发布了这款 Unitree G1 人形机器人的运动视频。视频中,Unitree G1不仅学着此前波士顿动力发布电动版Atlas的展示视频一样,从平躺开始做了一个“打挺”动作,还展示了小跑、招手、挥棒、自我蜷缩收纳、砸碎核桃、颠锅、焊接等等动作。
中美将举行人工智能政府间对话首次会议,交流科技风险及全球治理等问题
据外交部北美大洋洲司“宽广太平洋”公众号消息,为落实中美元首旧金山会晤共识,经双方商定,中美将于当地时间 5 月 14 日在瑞士日内瓦举行中美人工智能政府间对话首次会议,就人工智能科技风险、全球治理以及各自关切的其它问题进行交流。
2024年5月13日·周一
零一万物发布千亿参数闭源模型 Yi-Large 并升级开源模型版本
今天,在成立一周年之际,国内AI大模型独角兽零一万物重磅发布系列产品升级。闭源模型方面,零一万物发布全球SOTA千亿参数闭源大模型Yi-Large,评测结果部分超越GPT-4,同时,零一万物创始人及CEO李开复表示该公司正在训练更大参数规模的MoE模型Yi-XLarge MoE。在开源领域,零一万物将早先发布的Yi-34B、Yi-9B、6B中小尺寸开源模型版本升级为Yi-1.5系列,每个版本达到同尺寸中 SOTA 性能最佳。在媒体交流环节,李开复分享说,零一万物的C端海外生产力应用今年收入预计将达到1~2亿元,以国外用户订阅付费为主。
Sam Altman最新访谈:OpenAI将保持世界领先的地位,闭源战略是否正确还没有标准答案
OpenAI首席执行官山姆·奥特曼(Sam Altman)日前参加了播客节目“All-in Podcast”。在活动中,奥特曼谈到了推理计算、开源模型、语音交互、正在开发中的GPT-5大语言模型、人工智能监管、后人工智能时代实施全民基本收入(UBI)、先进的智能体将如何改变我们与应用的交互方式、发生在去年年末的OpenAI“宫斗”事件、“7万亿美元”芯片项目等一系列话题。
扎克伯格:GPU不再缺货,能源限制将成为新问题
Facebook 联合创始人兼首席执行官马克·扎克伯格 (Mark Zuckerberg) 认为,能源限制将成为 IT 行业的下一个瓶颈。他在最近的一次采访中表示,他认为长期的GPU荒已经基本结束,人工智能的增长和发展短期内不会受到资本限制的限制。相反,能源问题将成为下一个主要的关键点。扎克伯格告诉采访者 Dwarkesh Patel,随着 GPU 缺货的结束,企业将忍不住“投入大量资金来建设这些东西”,比如数据中心。然而,扎克伯格认为,在资本成为问题之前,工业将面临能源限制。
软银集团将向“AI革命”投资10万亿日元
日本软银集团(SBG)会长兼社长孙正义提出的“AI革命”开始启动。软银集团计划以AI半导体为突破口,把业务扩大到数据中心、机器人、发电等行业。预计投资额最高可达到10万亿日元规模(约合人民币4640.9亿元)。
微软将投资40亿欧元在法国发展数据中心
据法国24小时电视台(France 24)报道,微软投资的相关消息是在第七届“选择法国”投资峰会前宣布的,该峰会的目的是吸引外国投资者到法国投资。微软总裁Brad Smith表示,此举旨在加强其人工智能和云计算基础设施,这也是公司进入法国以来在该国最大的一笔投资。据悉,法国东部将会建立一个新的数据中心,巴黎地区和南部城市马赛的现有数据中心将得到扩展。
联发科或将与英伟达开发Arm架构AI PC处理器
据美国资本市场消息称,AI PC市场成长性看俏,联发科加足马力抢进,或将携手英伟达开发Arm架构的AI PC处理器,预计第三季度完成设计定案(tape out),第四季度进入验证。该款新芯片要价高达300美元,联发科或将在6月的台北国际电脑展上揭露与英伟达合作的AI PC处理器细节,英伟达CEO黄仁勋也将于6月2日台北国际电脑展开展前到达台湾。
英国AI安全研究所发布AI模型安全检测工具,以识别和评估相关风险
英国人工智能(AI)安全研究所本周五发布了发布了一个新的测试平台,旨在加强监测先进AI模型的安全风险。据介绍,该工具箱名为Inspect,可以用来评估一系列领域的AI模型,包括它们的核心知识、推理能力和自主能力。通过开源许可证发布,这意味着Inspect可以免费供全球AI社区使用。
2024年5月12日·周日
消息称软银旗下 Arm 公司将开发 AI 芯片,计划 2025 年秋季开始大规模生产
据日本经济新闻报道,软银旗下英国芯片设计公司 Arm 控股计划到 2025 年春季推出人工智能(AI)芯片原型产品。据悉,Arm 届时将成立一个 AI 芯片部门,AI 芯片将由承包商负责量产,预计将于 2025 年秋季开始大规模生产。外媒表示,一旦量产系统建立起来,Arm 的 AI 芯片业务可能会被剥离出来,并归入软银旗下。当下软银已经在与台积电等公司就制造问题进行谈判,希望确保产能。
OpenAI高管:AI颠覆性潜力是长期性的,外界可能高估了短期影响
在谈及生成式人工智能短期内可能不会促进生产力增长问题时,OpenAI首席运营官布拉德·莱特卡普(Brad Lightcap)的回答是“现在说还为时过早。”他补充称,重塑经济是“一项艰巨的任务”,不太可能在一年内就实现。但他相信,就算OpenAI现在停止新的开发,只要有GPT-4级技术,就足以对经济产生10到20年的扩散影响。莱特卡普的说法得到了在场其他AI公司高管的肯定,他们也确信这项技术有长期的颠覆性潜力。
消息称OpenAI正在开发AI语音助理,GPT-5或年底前发布
知情人士称,OpenAI准备展示一种全新的人机对话技术,该技术能同时使用声音和文本,并具备识别物体和图像的能力。据悉,ChatGPT的开发团队已向特定客户展示了其部分功能,其中包括比现有产品更出色的逻辑推理能力。知情人士透露,OpenAI可能最早在下周一的公开活动上预览这款升级后的AI。这一时间比谷歌I/O开发者大会早一天,此举意在抢在谷歌发布一系列人工智能产品之前,占据市场先机。
Anthropic 旗下 Claude App 上线苹果商店首周市场反响冷清
本月初,作为OpenAI最大劲敌的Anthropic在苹果应用商店上推出了其首款移动端应用程序 Claude APP ,为免费和付费用户提供了访问其Claude 3模型的新渠道。然而,尽管该应用程序提供了与其网站版本相同的功能,以及历史同步和照片上传功能,但在上线的第一周内,其全球总下载量仅为157000次。相比之下,ChatGPT在其App美国首发的前五天内(尽管也仅限于iOS端),就达到了48万次安装。
2024年5月11日·周六
苹果接近与OpenAI达成协议,将ChatGPT应用于iPhone
据知情人士透露,苹果公司即将与OpenAI达成协议。据称,双方一直在敲定一项协议的条款,以便在苹果的下一代iPhone操作系统iOS 18中使用ChatGPT功能。在上周的苹果财报电话会议上,库克强调,苹果将在人工智能领域占据优势。
消息称苹果升级版 Siri 语音助手有望亮相 WWDC 2024,基于生成式 AI 打造
据《纽约时报》报道,知情人士透露苹果公司预计将在下月举行的年度全球开发者大会(WWDC)上展示其人工智能领域的进展,届时该公司将发布改进后的 Siri 语音助手。报道称,Siri 的底层技术将包括一个新的生成式 AI 系统,赋予其聊天功能,而不是一次回答一个问题。知情人士称,苹果并未计划通过发布一款聊天机器人来与 ChatGPT 直接竞争,而是专注于让 Siri 更好地处理其现有任务。
OpenAI官宣下周一发布产品更新,但不会涉及GPT-5和搜索引擎
当地时间周五(5月10日),人工智能(AI)研究公司OpenAI表示,它将于下周一以直播的形式宣布产品更新。不过,该公司同时表示,届时不会发布GPT-5,也不会发布搜索引擎产品。OpenAI周五在社交媒体X(原推特)上宣布,将于太平洋时间5月13日(下周一)上午10点在其官网进行直播,届时将演示一些ChatGPT和GPT-4更新。
李彦宏:大模型百度走在最前面,我们要去勇闯无人区
据百度官方微信公众号消息,近日,在百度一场内部颁奖活动中,百度创始人、董事长兼首席执行官李彦宏指出,百度一直坚信技术可以改变世界,会一直沿着这条路走下去,他称,“大模型我们走在最前面,我们要去勇闯无人区,需要去冒前人没有冒过的风险。”
软银愿景基金持股组合缩水数百亿美元,孙正义转向AI和芯片
软银集团旗下的旗舰基金愿景基金(Vision Fund)近年来已悄悄抛售或减记了价值数百亿美元的上市公司股份。公司创始人孙正义正从曾经热衷的风险投资交易转向半导体和人工智能领域的战略投资。
2024年5月10日·周五
李飞飞最新访谈:并不担心AI末日,对过度炒作AI可能导致人类灭绝感到担忧
在美国当地时间周四,华裔人工智能科学家、斯坦福大学教授李飞飞现身旧金山科技峰会,与资深科技记者艾米丽·张深入探讨了人工智能的安全与伦理等热点问题。在对话中,李飞飞表示,公众关注的焦点应转向更为紧迫的问题,如人工智能所引发的虚假信息泛滥。她认为,当前对生成式人工智能技术的普遍“悲观情绪”存在过度渲染之嫌。她直言:“我对于过度炒作人工智能可能导致人类灭绝的风险感到担忧。”
报道称美国将出台管制措施,限制AI大模型出口中国
据国外媒体报道,美国正计划推出新的AI管制措施,旨在限制专有或闭源AI大模型出口至俄罗斯、中国、朝鲜和伊朗等国家。该计划还将特别针对ChatGPT等AI模型的核心软件,为其设置出口管制。这一举措被视为美国过去两年一系列管制措施的延续,这些措施包括限制向中国出口高端AI芯片,以减缓中国在尖端技术领域的发展速度。目前美国政府已采取措施,阻止AI芯片及其制造工具流向中国,并要求AI公司在外国客户使用其服务训练可能用于网络攻击的AI模型时通报政府。
三星 AI 推理芯片 Mach-1 即将原型试产,有望基于 4nm 工艺
韩媒 ZDNet Korea 援引业内人士的话称,三星电子的 AI 推理芯片 Mach-1 即将以 MPW(多项目晶圆)的方式进行原型试产,有望基于三星自家的 4nm 工艺。这位业内人士还表示,不排除 Mach-1 采用 5nm 工艺的可能。三星已为 Mach-1 定下了时间表:今年下半年量产、今年底交付芯片、明年一季度交付基于该芯片的推理服务器。
报道称 OpenAI 计划下周一宣布人工智能搜索引擎
OpenAI计划下周一5月13日宣布其基于AI的搜索产品,以期与谷歌搜索竞争。最早的爆料是OpenAI于本周四宣布,几天前报道称该时间被推迟。最新爆料的5月13日就在谷歌一年一度的“Google I/O”大会的前一天。
苹果最新爆料:将通过自研芯片在云端推出AI功能
根据爆料,苹果将在云计算服务器中部署高端芯片,用于处理苹果设备上最先进的AI任务,至于那些更简单的AI相关功能将直接由iPhone、iPad和Mac内置的芯片来处理。苹果目前计划使用自家数据中心来运行云功能,但最终将依赖外部设施,正如iCloud和其他服务一样。
DeepMind CEO 表示可完成复杂任务的AI智能体将在未来一两年内推出
谷歌 DeepMind 首席执行官 Demis Hassabis 预计,在不久的将来,人工智能系统不仅能够回答问题,还能独立计划和行动。Hassabis 在接受彭博社采访时表示,他的公司正在开发这种“类似智能体”的系统,可能会在一到两年内投入使用。
TikTok 将识别并标注第三方 AI 生成的内容
短视频平台 TikTok 正加强识别和标注人工智能 (AI) 生成内容的举措。继既有功能可以自动识别并标记使用 TikTok 自家 AI 工具创作的内容后,TikTok 还将识别其他平台生成的 AI 内容,并对其进行标注。
谷歌CEO最新访谈:AI浪潮尚处于早期阶段,准备好打持久战
据国外媒体报道,近日,谷歌及其母公司Alphabet首席执行官桑达尔·皮查伊接受了《The Circuit With Emily Chang》主持人兼执行制片人艾米丽·张的独家专访。在这场对话中,他们探讨了搜索的未来、谷歌如何从头开始重新构建其人工智能模型Gemini、与微软和OpenAI的竞争、谷歌在企业文化方面的挑战。此外,皮查伊还分享了自己的成长经历,并讲述了这些经历如何让他为应对当前的挑战做好准备。
马斯克旗下xAI公司有望本周完成新融资,成立10个月估值就达180亿
据媒体报道,知情人士透露,埃隆·马斯克旗下的人工智能初创公司X.AI Corp.(简称“xAI”)有望最快在本周完成一轮融资。半个月前曾有报道提到,xAI将在融资中筹集60亿美元,投资者中将包含红杉资本(Sequoia Capital),最终将使这家成立不到10个月的人工智能初创公司的估值达到约180亿美元。知情人士补充称,这轮融资的规模尚未最终确定,目前正在进行审议,估值和官宣时间等细节可能会发生变化。
估值 60 亿美元,法国 AI 初创公司 Mistral AI 即将达成新融资协议
据《华尔街日报》今日报道,法国初创公司 Mistral AI 即将达成一项以 60 亿美元(当前约 433.8 亿元人民币)估值进行融资的协议,与半年前相比,这一估值水平几乎达到了当时的三倍。在去年 12 月的融资中,Mistral 的估值为 21.5 亿美元。据知情人士透露,现有支持者 General Catalyst 和 Lightspeed Venture Partners 预计将是新一轮融资的主要金主,Mistral 将在此轮融资中筹集约 6 亿美元。
抖音剪映旗下Dreamina更名为“即梦”,AI绘画和AI视频功能全量上线
剪映 Dreamina 官宣其品牌正式更名为中文“即梦”,同时宣布其AI作图和AI视频生成功能已全量上线。“即梦”作为一个全新的品牌,其核心功能包括图片生成、智能画布和视频生成,旨在为用户提供更为便捷、智能的创作体验。
阿里云发布通义千问2.5,称性能得分追平GPT-4 Turbo
阿里云正式发布了通义千问2.5,模型性能全面赶超GPT-4 Turbo。据了解,通义千问2.5最新开源的1100亿参数模型在多个基准测评中均取得了最佳成绩,成功超越了Meta的Llama-3-70B模型,成为开源领域的新标杆。相比通义千问2.1版本,通义千问2.5在上述四项能力上分别提升了9%、16%、19%和10%,其中中文能力更是持续领先业界。在权威基准OpenCompass上,通义千问2.5的得分追平了GPT-4 Turbo。
2024年5月9日·周四
谷歌AlphaFold 3首发Nature,预测精准度提高100%
谷歌DeepMind和其英国子公司Isomorphic Labs联合团队在《自然》杂志上发表一份共46页的重要成果,联合发布全新AI蛋白质结构预测模型AlphaFold 3,可准确预测生物分子相互作用的结构。对于蛋白质与其他分子的相互作用,与现有预测方法相比,AlphaFold 3改进了至少50%;对于一些重要的相互作用领域,AlphaFold 3预测精(准确)度提高一倍(100%)。
微软将投资33亿美元在美国威斯康星州建设人工智能中心
微软表示将投入33亿美元在美国威斯康星州建设一个数据中心,旨在培训员工和制造商如何更好地使用人工智能。该公司称,它将利用人工智能中心培训约10万名工人。微软还计划在威斯康星大学密尔沃基分校的校园内开设一个实验室。
微软称 75%“知识工作者”已在工作中使用生成式 AI,过去半年内翻番
微软日前公布了年度工作趋势指数报告,数据显示,75% 的“知识工作者”已经在工作中使用生成式 AI,这一数据在过去的 6 个月中翻了一番。数据显示,41% 的领导者正在试图以 AI 为中心“从零开始”重建整个业务;而 60% 的领导者则在担心自己的公司缺乏对 AI 的重视,以及公司融入 AI 的计划和愿景。
2024年5月8日·周三
谷歌发布 Pixel 8a 手机:主打 AI 功能,起售价 499 美元
谷歌今天正式发布了 Pixel 8a 手机,将于 2024 年 5 月 14 日在美国发售,128GB 版本售价为 499 美元(当前约 3598 元人民币),256GB 版本售价为 559 美元(当前约 4030 元人民币)。谷歌 Pixel 8a 手机最大的亮点在于继承了部分高级功能之外,引入了诸多 AI 功能,可以运行 Gemini Nano 模型,此外具备 Audio Magic Eraser 和 Best Take 等技能。
郭明錤:英伟达下一代AI芯片R系列/R100将在明年四季度量产
天风国际分析师郭明錤预测,英伟达下一代AI芯片R系列/R100将在2025年4季度量产,系统/机柜方案预计将在2026年上半年量产。据悉,R100将采台积电的N3制程与CoWoS-L封装(与B100相同)。R100采用约4x reticle设计 (vs. B100的3.3x reticle设计)。目前,英伟达已经意识到,AI服务器的高耗能已成为CSP(云服务提供商)/Hyperscale(超大规模数据中心)采购和数据中心建设的重要挑战。因此,在R系列芯片与系统方案的设计中,除了提升AI算力外,还特别注重了能耗的改善,以满足市场对高效能、低功耗AI解决方案的迫切需求。
OpenAI与《人物》出版商签署合作协议,将用其内容训练ChatGPT
美东时间周二,OpenAI宣布与数字媒体公司Dotdash Meredith签署了一项内容许可协议,该协议允许OpenAI将这家出版商的内容引入ChatGPT,并帮助训练其最先进的人工智能(AI)模型。根据当天宣布的合作伙伴关系,OpenAI将能够在其聊天机器人中显示来自美国最大的数字和印刷出版商的许多网站的生活方式和娱乐内容。此外,Dotdash Meredith也将能够利用OpenAI的模型来改进其广告定位工具。不过两家公司没有透露详细的财务条款。
AIGC 应用爆发,相关岗位需求增长超 300%、平均招聘年薪超 40 万元
央视财经昨日报道称随着 AI 应用的爆发,生成式人工智能(AIGC)的招聘市场十分火爆。数据显示,今年一季度,生成式人工智能相关职位需求同比增长超三倍。某招聘平台负责人戴科彬表示,从全平台增长较好的职位类别来看,增长率达到 60% 已经算是非常突出的表现了,而 AIGC(生成式人工智能)相关岗位的同比增长超过了 320%。
苹果新一代 AI PC 芯片 M4 推出,NPU 速度和设备运行速度大幅提升
在昨晚举行的“Let freeze”特别新品发布会上,苹果公司正式发布全新iPad Pro,配备全新、专为 AI 打造、基于ARM架构的新一代AI PC芯片Apple Silicon M4。全新M4芯片采用台积电第二代3nm工艺,拥有最高280亿个晶体管,支持全新串联OLED显示引擎,其CPU性能比M2快50%,GPU性能比M2提升4倍,内置全新NPU(新的神经引擎),支持每秒38万亿次 AI 计算处理能力,比苹果A11芯片的神经网络引擎快可达60倍(6000%)。
OpenAI 高管:今天的 ChatGPT 将在一年内显得“糟糕得可笑”
OpenAI 首席运营官布拉德・莱特卡普 (Brad Lightcap) 近日表示,以 ChatGPT 为代表的生成式 AI 聊天机器人将在未来 12 个月内取得突破性进展,我们现在使用的系统届时将显得糟糕得可笑(laughably bad)。莱特卡普补充说,人工智能工具将能够比以往承担更复杂的任务,人工智能工具将成为用户的 “绝佳队友”,帮助他们处理 “任何给定问题”。
消息称苹果照片应用将引入AI编辑,实现Photoshop级P图
根据国外科技媒体 AppleInsider 报道,苹果公司计划提高“照片”(Photos)应用的 AI 技能,让其实现“Photoshop 级别的编辑”功能。消息源向该媒体透露,苹果内部正在测试增强版“照片”应用程序,利用生成式人工智能编辑图片。该功能在苹果 macOS 15 预发布版本中称之为“Clean Up”,位于新版本照片应用程序的编辑菜单中,位于现有的调整、滤镜和裁剪选项之中。
亚马逊拟投资90亿美元在新加坡扩大云计算基础设施业务
亚马逊计划斥资90亿美元扩大其在新加坡的云计算基础设施。该公司周二表示,这笔支出将在未来四年内完成,将使亚马逊云计算业务(AWS)在新加坡的投资增加一倍。这有助于满足客户对云计算服务日益增长的需求,并加速对人工智能的采用。
马斯克:人工智能目前在太空探索领域表现不佳
埃隆・马斯克近期参加了第 27 届米尔肯全球大会,在谈话中,这位特斯拉和 SpaceX 的 CEO 表达了对人工智能 (AI) 的看好,认为“追求真理”的人工智能可以“促进人类文明发展”。然而,当被问及人工智能是否能 “加速” 太空探索进程时,他的态度却并不那么热切。马斯克说,“事实上,太空探索领域几乎没有用到人工智能。SpaceX 和 Starlink 基本不使用人工智能技术。这并不是因为我反对,而是因为目前为止我们还没找到合适的应用场景。”
软银领投、英伟达参与,英国自动驾驶公司Wayve融资10.5亿美元
近日,英国AI自动驾驶初创企业Wayve完成了10.5亿美元融资,为其将自动驾驶技术推向汽车市场再添重要助力。这是欧洲AI初创企业有史以来获得的最大一笔融资。本轮融资由软银牵头,老股东微软、新投资者英伟达等跟投,Wayve未披露其最新估值,不过有媒体推测其最新估值应该已经达到数十亿美元。
DeepSeek开源MoE模型,性能直逼GPT-4-Turbo
近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。DeepSeek-V2 参数量达 236B,其中每个 token 激活 21B 参数,支持 128K token 的上下文长度。DeepSeek-V2 的模型表现非常亮眼:在 AlignBench 基准上超过 GPT-4,接近 GPT-4- turbo;在 MT-Bench 中与 LLaMA3-70B 相媲美,并优于 Mixtral 8x22B;擅长数学、代码和推理。
2024年5月7日·周二
苹果正在开发用于数据中心的AI芯片,寻求在竞争中占据优势
据国外媒体报道,苹果公司一直在研发自家芯片,旨在用于数据中心服务器,以运行尖端的人工智能软件。这一战略性举措可能使苹果在愈演愈烈的人工智能竞赛中占据优势地位。据内部人士透露,这个服务器项目的内部代号为ACDC项目(Apple Chips in Data center,苹果数据中心芯片),苹果可能将芯片用于自家服务器上。
微软将推出自研AI大模型 MAI-1,同谷歌和 OpenAI 展开竞争
据The Information报道,美国科技巨头微软公司(Microsoft)将推出一款参数达5000亿的全新 AI 模型产品,内部称为MAI-1。报道称,MAI-1由前谷歌AI负责人、Inflection CEO穆斯塔法·苏莱曼 (Mustafa Suleyman)负责领导开发,将远远大于微软之前训练过的任何小开源模型,约5000亿参数可调整或设置来确定模型在训练期间学习哪些内容,并且它将与Inflection之前发布的Pi模型是分开的。消息人士预计,MAI-1最快在5月举行的微软Build开发者大会上预览这款新模型,具体取决于未来几周开发情况。
程序员问答平台 Stack Overflow 宣布与 OpenAI 建立 API 合作伙伴关系
程序员问答平台 Stack Overflow 与 OpenAI 今天宣布建立新的 API 合作伙伴关系。OpenAI 和 Stack Overflow 将通过 OverflowAPI 为 OpenAI 用户提供所需的准确、经过审核的数据基础,以便 AI 工具快速找到问题解决方案,令技术人员能够专注于高优先级的任务;OpenAI 还将在 ChatGPT 中直接显示来自 Stack Overflow 的经过验证的技术知识和代码。
2024年5月6日·周一
智谱AI正研发对标Sora的国产文生视频模型,最快年内发布
据钛媒体报道,估值超200亿的国内 AI 大模型独角兽公司“智谱 AI”正在研发对标OpenAI Sora的高质量文生视频模型,预计最快年内发布。据悉,成立于2019年的智谱 AI,由清华大学计算机系的技术成果转化而来,源自清华大学知识工程(KEG)实验室。智谱 AI 是国内最早入局大模型赛道的公司之一,也是目前国内头部大模型厂商代表之一。
迁移科技获数千万元B轮融资,专注3D视觉机械臂引导
迁移科技近期完成数千万元B轮融资,由善达基金领投。迁移科技成立于2017年,是行业领先的3D工业相机和3D视觉系统供应商, 累计完成数亿元融资。基于在3D相机硬件、算法和软件方向的多年技术积累,迁移科技打造了稳定、易用、高回报的AI+3D视觉系统,可应用于上下料、拆码垛、定位装配等场景,为全球工业制造和仓储物流自动化技术赋能。
耐600℃高温存储器问世,有助开发极端环境下人工智能计算系统
美国宾夕法尼亚大学科学家研制出一款可在600℃高温下持续工作60小时的存储器。这一耐受温度是目前商用存储设备的两倍多,表明该存储器具有极强的可靠性和稳定性,有望在可导致电子或存储设备故障的极端环境下大显身手,也为在恶劣条件下进行密集计算的人工智能系统奠定了基础。相关论文发表于新一期《自然·电子学》杂志。
2024年5月5日·周日
特斯拉分享第二代 Optimus 机器人工作视频:可将电池精确插入托盘
特斯拉今日再次分享了一段第二代 Optimus 人形机器人的工作视频,视频显示,该机器人可将电池单体精确地插入托盘中。据特斯拉官方介绍,他们训练并部署了一个神经网络,允许 Optimus 开始执行有用的任务,例如从传送带上捡起电池单体并精确地将它们插入托盘中。这个神经网络完全端到端运行,意味着它只使用来自机器人的 2D 摄像头以及板载的本体感知传感器的视频,并直接产生关节控制序列。
巴菲特:AI就像原子弹,我们打开了潘多拉魔盒
在一年一度的股东大会上,巴菲特分享了自己对生成式AI的看法。巴菲特坦言:“我对人工智能知之甚少。但这并不意味着这项技术不重要。”他进一步解释说,尽管无法对AI的未来影响做出准确预测,但他认识到AI具有巨大的潜力,并且其快速发展令他感到不安。巴菲特比喻说:“去年我就提到过,我们就像是让精灵从瓶子里跳出来,尤其是当我们发明核武器的时候,它已经造成了一些负面后果。这种力量有时会让我感到害怕,而且这个精灵已经无法再放回瓶中。”他认为AI的情况可能与此类似,已经释放出来,并且在许多方面发挥着重要作用。
2024年5月4日·周六
李飞飞成立“空间智能”方向的初创公司,已完成种子轮融资
最新消息,斯坦福大学教授李飞飞正在建立一家AI公司,已完成种子轮融资。公司方向定为“空间智能”——旨在让AI能像人类一样对视觉信息进行高级推理。消息人士表示,这将是该技术的一次飞跃。投资方包括硅谷风投a16z和Radical Ventures。作为AI领域影响力最大的女性和华人,李飞飞长期对学术界和工业界贡献斐然。她在斯坦福拿下终身教职,曾担任谷歌云AI首席科学家、推动Google AI中国中心成立、并长期统筹谷歌云AI、谷歌大脑以及中国本土团队工作。
摩根大通旗下投资顾问 IndexGPT 正式上线
一年前,摩根大通为某种人工智能(AI)工具申请以“IndexGPT”这个词注册商标曾引发猜测,现在该行终于推出了以这个词命名的产品。IndexGPT借助OpenAI的GPT-4模型,创建新的系列主题投资一篮子股票。这个工具会生成主题相关的关键字列表,然后将其输入另一个自然语言处理模型,这个模型扫描新闻以识别涉及该领域的公司。
微软发布首份 AI 透明度报告:2023 年创建 30 个负责任的 AI 工具
微软公司近日发布了新的透明度报告,概述了 2023 年制定并部署了各种措施,负责任地发布各项生成式产品。微软在《负责任的人工智能透明度报告》中,介绍了在安全部署人工智能产品方面取得的成就,共创建了 30 个负责任的人工智能工具,扩大了负责任的人工智能团队,并要求开发生成式人工智能应用程序的团队在整个开发周期中衡量和绘制风险。
2024年5月3日·周五
消息称 OpenAI 将于 5 月 9 日发布 ChatGPT 版搜索引擎
最新消息称 OpenAI 有望今年 5 月 9 日推出基于 ChatGPT 的全新搜索产品,进一步挑战谷歌的传统搜索巨头地位。Reddit 网友近日发帖,表示 search.chatgpt.com 域名和相关的 SSL 证书已经被创建,网友 @nonmayorpete 发布推文称该域名将于 5 月 9 日上线。
英特尔18A工艺Panther Lake CPU将于2025年中推出,有望大幅提升AI性能
在英特尔最新的财报电话会议中,该公司展示了其即将推出的产品,并明确表示将在下一个主要CPU平台上全力推动人工智能的发展。首席执行官Pat Gelsinger确认,即将推出的18A工艺豹湖(Panther Lake)CPU进展顺利,预计将在2025年中期推出。他表示Panther Lake的人工智能能力将比今年晚些时候推出的Arrow Lake芯片翻倍。
2024年5月2日·周四
消息称苹果 CEO 库克将在下周的发布会预告全新 AI 功能
《华盛顿邮报》今晚报道称,为重振消费者热情,苹果 CEO 库克预计下周预告新的人工智能功能,并于 6 月的全球开发者大会上公布。具体来看,库克将在下周的“放飞吧”(Let Loose)活动中对 AI 功能进行预热。根据官方消息,苹果将于 5 月 7 日晚上 10 点举办这场特别活动。从海报来看,此次活动预计将重点关注新一代 iPad 硬件和配件,例如大家期待已久的 iPad Pro 和 Apple Pencil 等。
SK海力士:AI芯片明年订单近满 Q3开始量产下一代HBM芯片
SK海力士表示,到明年为止,高带宽存储(HBM)芯片的生产能力已接近满负荷,这表明,人工智能(AI)开发所必需的半导体需求非常旺盛。这家韩国公司周四在一份声明中表示,目前计划在第三季度开始批量生产下一代HBM芯片。此举旨在使SK海力士在提供先进组件方面领先于三星电子,后者与英伟达的加速器一起创建和托管人工智能平台。
微软宣布在马来西亚投资22亿美元发展云计算和人工智能服务
微软5月2日宣布,将于未来4年内投资22亿美元以支援马来西亚的数码化转型,这是微软进军马来西亚以来的最大单笔投资。该投资包括:建设云端和AI基础建设;为另外的20万马来西亚人提供AI技能培训机会;加强与马来西亚政府的合作,建立全国AI卓越中心;支援马来西亚程式开发员社群的发展。
GPU 云提供商 Coreweave 完成 11 美元 C 轮融资,估值 190 亿美元
CoreWeave 是一家专业的GPU云提供商,旨在通过大规模定制解决方案为最复杂的工作负载提供支持。5 月 1 日,Coreweave 宣布已获得 11 亿美元的新资金,由 Coatue 领投,领投最后一轮初选的 Magnetar 也参与其中。以及 Altimeter Capital、Fidelity Management & Research Company 和 Lykos Global Management。Coreweave 最新估值达到 190 亿美元,比五个月前的 70 亿美元几乎增长了两倍,新资金将用于支持所有业务领域的快速增长,以及 CoreWeave 向新地理区域的扩张,以满足全球 GPU 加速云基础设施的爆炸性需求。
2024年5月1日·周三
Claude 推出苹果 iOS 版 App,最新模型号称超越 GPT-4
人工智能初创公司 Anthropic 今日首次推出了旗下大模型产品的移动端 Claude App ,目前仅有 iOS 版。而且相比于 ChatGPT、Gemini 等竞争对手,Claude 的进度显得慢了好几拍。据介绍,该应用除了提供聊天机器人等基础功能之外,还支持上传照片、分析图像。在此之前,Claude 只能通过网站或第三方模型库来使用。
八家新闻机构起诉OpenAI、微软,指控其AI工具侵犯版权
美东时间周二,美国八家新闻机构在纽约联邦法院对OpenAI、微软提起诉讼,指控这两家公司在未经许可的情况下,使用了它们的新闻作品来训练生成式人工智能(AI)。据悉,这八家新闻机构分别为《纽约每日新闻》、《芝加哥论坛报》、《奥兰多哨兵报》、《水星报》、《丹佛邮报》、《先锋新闻》等,它们均属于一家叫做奥尔登全球资本公司的对冲基金。
AI热潮推动存储芯片需求,三星营业利润飙升931%
得益于AI开发热潮推动存储芯片价格反弹,三星电子今年第一季度利润大增,半导体业务自2022年以来首次恢复盈利。4月30日,三星披露了第一季度财报数据:营业利润增加至6.61万亿韩元(约48.5亿美元),同比猛增931.8%。净利润为6.62万亿韩元,是上年同期的四倍多,高于分析师平均预测的5.63万亿韩元。营业收入同比增长13%至71.9万亿韩元,其中内存芯片收入同比增长96%至17.49万亿韩元。
2024年4月30日·周二
消息称苹果挖走大量谷歌顶尖人才,建立神秘人工智能实验室
据《金融时报》报道,苹果公司从谷歌挖走了数十名人工智能专家,并在瑞士苏黎世建立了一个“神秘的欧洲实验室”,以组建一支新的团队,负责研发人工智能模型和产品。该报道称,实验室的员工参与了苹果研究类似于 OpenAI 的聊天机器人 ChatGPT 和其他基于大型语言模型 (LLM) 的产品的底层技术。研究重点在于设计更先进的人工智能模型,可以结合文本和视觉输入来生成回复。
月之暗面Kimi+更新,上线全新智能体商店
月之暗面旗下的Kimi智能助手更新了Kimi+,上线了官方智能体商店。目前智能体主要分为官方推荐、办公提效、辅助写作、社交娱乐、生活实用五大分类。用户在与Kimi聊天时,可随时@Kimi+,召唤相应的私人助理。
微软将投资17亿美元在印尼建设云计算和人工智能基础设施
微软公司将投资17亿美元在印尼建设云计算和人工智能基础设施,押注这个东南亚最大经济体以刺激增长。微软首席执行官Satya Nadella宣布将在四年内布局这笔支出,此前他与印尼总统佐科·维多多周二在雅加达会晤。该公司还承诺帮助东南亚250万人接受人工智能技能培训,其中包括印尼的84万人。
国资委:加快人工智能等新技术与制造全过程、全要素深度融合
4月28日,国务院国资委召开中央企业大规模设备更新工作推进会。国务院国资委党委书记、主任张玉卓强调加快推动数字化转型,大力推进“智改数转网联”、智能制造装备应用、数字基础设施建设,加快人工智能等新技术与制造全过程、全要素深度融合。
OpenAI 向 ChatGPT Plus 用户开放“记忆”功能
OpenAI 公司今天宣布,面向所有 ChatGPT Plus 用户开放“记忆”(Memory)功能,可以让 ChatGPT 记住用户在聊天中讨论过的事情,并避免重复信息。用户可以控制 ChatGPT 需要记住的内容,可向 ChatGPT 发出明确指令使其记住指定内容,同时也可以询问 ChatGPT“你记住了什么”。
苹果新款iPad Pro或搭载M4芯片,强化人工智能功能
据彭博社Mark Gurman最新爆料:苹果将在5月份发布新版iPad Pro,直接搭载M4芯片,跳过M3。从目前流传的消息来看,M4芯片依旧采用台积电3nm工艺,主要提升的是神经网络引擎的性能,可以让AI功能用起来更加丝滑。根据古尔曼更早的爆料,M4系列芯片或许也可能像M3一样,配有M4、M4 Pro和M4 Max三个版本。具体到iPad Pro,增强的神经网络引擎性能可以让解锁iPad时的人脸识别等功能提到提升。
2024年4月29日·周一
英国《金融时报》与OpenAI达成协议,授权后者使用其资料库训练AI模型
英国《金融时报》(Financial Times)宣布与OpenAI达成协议,将授权后者使用其资料库来训练AI模型。此前,OpenAI已经与美国的美联社、德国的施普林格(Axel Springer)、法国的《世界报》和西班牙的Prisa Media等四家媒体达成了类似协议。
小红书内测自研大模型“小地瓜”,社交和搜索是落地方向
36氪从多个独立信源获悉,由小红书AI创新负责人张德兵(薯名:宇尘)牵头的大模型团队,在部分内部产品灰度测试自研通用大模型基座“小地瓜”。小红书AI产品的探索,则主要由小红书产品和设计负责人邓超(薯名:樱木)负责。
OpenAI Sora的首批专业级视频被曝依靠大量后期实现
上个月,OpenAI 与一群艺术家联合发布了七部超现实主义的专业大片。然而,在影视从业者感叹饭碗不保时,和 OpenAI 合作的加拿大制作公司 Shy Kids 近日接受了外媒 Fxguide 的专访,并一语道破了 Sora 最中肯的使用情况:Sora 很好,但取代人类还为时过早。Sora 生成的视频片段需要经过色彩分级、处理和稳定处理,以及分辨率提升。另外,Sora无法直接渲染特定的镜头运动,需要在后期制作中进行调整。
对标妙鸭相机,抖音上线AI写真相机“星绘”APP
据Tech星球报道,抖音的Flow部门上线了一款“ 星绘APP ”,这是一款AI相机类的产品。值得注意的是,在国外,字节也上线了一款功能相似的APP“Picpic”。据悉,星绘提供丰富的AI生图能力,可以创建处在AI世界的用户,还能够定制多样的分身效果。打开“星绘”APP后,会默认让用户创建一个AI分身,需要上传或拍摄3张头像照片,经过数十分钟分钟的等待后,即可创建出一个基于用户的AI分身。
中国独角兽企业已达369家,六成以上与AI、芯片等硬科技赛道有关
4月28日举行的2024中关村论坛“全球独角兽企业大会”上发布全新《中国独角兽企业发展报告(2024年)》。报告显示,截至2024年3月,中国共有独角兽企业369家,其中,本次入榜的 AI、量子科技、智能制造等“硬科技”赛道独角兽企业共计231家,占独角兽总数的6成以上(62.6%),仅 AI 领域就有52家独角兽企业,其中13家为新晋企业。
ChatGPT在奥地利遭投诉,因提供个人信息有误
奥地利的隐私倡导组织NOYB针对OpenAI公司的ChatGPT提起了投诉,该组织指责OpenAI没有更正ChatGPT提供的错误信息。ChatGPT这一行为可能违反欧盟法律,因为后者规定个人数据必须准确。
英伟达黄仁勋称 AI 不会完全取代人类工作
当地时间周日晚间,英伟达 CEO 黄仁勋接受美国哥伦比亚广播公司(CBS)《60 分钟》节目采访,谈到自己对人工智能的最新看法。其称,随着人工智能对企业的帮助(日益增加),企业自然会扩大规模,人类工作不会因此消失。黄仁勋表示,公司收益是同生产力一起增加的,自己从未见过哪个公司在盈利增加的同时,没有雇佣更多员工。“即使有些工作被淘汰了,我相信,你仍然希望人类参与其中,因为我们有很好的判断力,有些情况机器是无法理解的。”
特斯拉CEO马斯克:今年将投资100亿美元用于AI训练和推理
日前,特斯拉CEO马斯克在社交媒体上表示,“今年特斯拉将会投资约100亿美元用于AI的训练和推理,而推理主要用于汽车。”马斯克还补充道,任何支出达不到每年100亿美元水平或者无法高效部署的公司,都无法在市场上竞争。
2024年4月28日·周日
前妙鸭张月光创立「沐言智能」,目前已进行四轮融资、近 3 亿人民币
据AI科技评论,去年爆款AI写真产品「 妙鸭 」产品负责人张月光离职创业后,已经进行四轮融资,融资金额接近 3 亿人民币。2023 年末,张月光从阿里离职,创立新公司「北京沐言智语科技有限公司」(以下简称「沐言智语」)。据悉,短短不到半年,沐言智语已进行四轮融资。值得注意的是,沐言智语是在还没有发布任何新产品、跑通商业模式的情况下拿到 4 轮融资,共计近 3 亿人民币,在当前资本艰难的市场环境下十分稀缺。
元象发布多模态大模型 XVERSE-V,支持任意宽高比图像输入
元象今日发布多模态大模型 XVERSE-V,支持任意宽高比图像输入,在主流评测中效果领先。该模型全开源,无条件免费商用。XVERSE-V性能优异,在多项权威多模态评测中超过零一万物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型,在综合能力测评MMBench中超过了谷歌GeminiProVision、阿里Qwen-VL-Plus和Claude-3V Sonnet等知名闭源模型。
苹果高管:Mac是最好的AI电脑,今年会有更多关于AI的进展分享
近日苹果产品营销总监在接受采访时表示:“实际上苹果从2020年第一款M系列芯片M1推出的时候,就已经开始AI的部署了”、“Mac 是用户可以买到的最好的操作生成式AI的个人电脑产品,在M1芯片上出现的神经网络引擎,就是可以实现生成式AI的架构设计”。尽管目前苹果还没有类似生成式的 AI 大语言模型产品的推出,但实际上通过处理器底层的能力,苹果已经在 Mac 上实现了很多由 AI 驱动的功能,比如 Siri 的听写、还有 Live text 实况文本,以及视频或照片编辑里的对象提取,视频会议的人像模式背景虚化等等。
谷歌计划投资30亿美元用于新建及扩建现有数据中心
谷歌宣布将投资30亿美元在印第安纳州建立新的数据中心园区,并对弗吉尼亚州的现有设施进行扩建。这项投资计划中,20亿美元将被用于在韦恩堡建设印第安纳州的园区,而另外10亿美元则用于扩展弗吉尼亚州内三个现有的数据中心。此外,谷歌还推出了价值7500万美元的人工智能机会基金,旨在提供AI技能培训。
全面走向“人工智能+”,国内首个汽车大模型标准发布
中国信息通信研究院今天(28日)发布了国内首个汽车大模型标准。标准主要涵盖三个能力域,其中场景丰富度侧重评估汽车大模型对智能座舱和自动驾驶等细分场景的支持情况,能力支持度重点关注汽车大模型在感知、理解、推理、生成等人工智能技术能力上的表现,应用成熟度主要评估汽车大模型在系统生态、部署定制、场景适配等方面的应用情况。
科大讯飞下月将推出语音台历产品,搭载星火 AI 大模型
科大讯飞周六在互动平台透露,公司将于 5 月在京东、天猫等电商平台上新搭载星火大模型的语音台历,具备更广泛的知识覆盖、更强的理解能力及更自然的人机交互。这款语音台历产品的更多配置、规格信息,目前官方没有过多透露。
2024年4月27日·周六
清华大学成立人工智能学院,图灵奖获得者姚期智任院长
清华大学今日宣布成立人工智能学院,聚焦“人工智能核心基础理论与架构”和“人工智能 + X”两个重点方向,以高定位和新机制建设中国自主的“AI 顶尖人才和原始创新基座”,为实现高水平科技自立自强提供有力支撑。
生数科技联合清华大学正式发布中国首个长时长视频大模型「Vidu」
今日,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——「 Vidu 」。该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
通义千问推出Qwen1.5-110B:Qwen1.5系列的首个千亿参数开源模型
近日,通义千问团队宣布开源1100亿参数的Qwen1.5系列首个千亿参数模型Qwen1.5-110B,该模型在基础能力评估中与Meta-Llama3-70B相媲美,在Chat评估中表现出色,包括MT-Bench和AlpacaEval 2.0。Qwen1.5-110B与其他Qwen1.5模型相似,采用了相同的Transformer解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持32K tokens的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。
OpenAI Startup Fund 风险基金筹集了 1500 万美元的最新资金
根据外媒最新消息,OpenAI Startup Fund 已悄然完成了 1500 万美元的投资,这是一家与 OpenAI 相关但在技术上独立于 OpenAI 的风险基金,专门投资于教育、法律和科学领域的早期阶段、通常与人工智能相关的公司。根据 SEC 文件,4 月 19 日前后两名投资者向该基金捐赠了 1500 万美元的资金。此外,最新的文件显示 OpenAI Startup Fund 的经理&唯一合伙人为 Ian Hathaway。
谷歌正测试全新 AI 功能,可为用户提供英语口语练习
据网友透露,谷歌近日正测试“Speaking practice”功能,通过生成式 AI 增强英语口语练习,并通过示例帮助学习者提高口语。谷歌 Search Labs 目前已经在阿根廷、哥伦比亚、印度、印度尼西亚、墨西哥和委内瑞拉进行测试该功能,后续可能会扩展到全球更多国家和地区。
苹果重启与OpenAI的谈判,拟在新产品中添加人工智能新功能
据知情人士透露,苹果公司已重启与OpenAI的谈判,打算使用这家初创公司的技术来为今年晚些时候推出的iPhone的一些新功能提供支持。知情人士表示,两家公司已经开始讨论可能达成的协议的条款,以及OpenAI的功能将如何整合到苹果的下一代iPhone操作系统iOS 18中。今年早些时候,苹果曾与OpenAI就交易进行过讨论,不过自那以来双方似乎并未真正进行合作。与此同时,苹果据称还在与Alphabet Inc.旗下的谷歌就授权使用后者的Gemini聊天机器人进行谈判。
2024年4月26日·周五
美国政府据悉设立AI安全委员会,成员包括黄仁勋、山姆·奥特曼等科技巨头高管
英伟达CEO黄仁勋、OpenAI首席执行官山姆·奥特曼、微软CEO纳德拉、Alphabet首席执行官皮查伊等科技巨头高管将加入一个新的美国联邦咨询委员会,该委员会的工作重点是在美国关键基础设施中安全使用人工智能。据悉,该委员会将由近20人组成,小组成员还包括政府官员、学者、民权领袖以及关键基础设施行业高管。
B站发布必剪Studio:国内首个免费数字分身定制工具
B站发布国内首个免费数字分身定制工具“ 必剪Studio ”。据悉,必剪Studio内一站式集成“数字分身”及“音色定制”功能,能帮助出镜创作者、录音创作者有效提升创作效率。其中“数字分身”技术可利用真人视频、语音,借助AI技术1:1生成人物数字模型,获得模型后,UP主只需导入录音文件或输入文本,即可生成类似实拍效果的出镜口播视频,节省常规创作流程中的实拍出镜环节。
OpenAI 奥特曼斯坦福演讲:GPT-5 聪明程度超乎想象
昨日,OpenAI CEO Sam Altman 在斯坦福大学的英伟达礼堂进行了一场公开演讲,向在场的 1000 多名与会者分享了他对人工智能未来的洞见。从 GPT-5 的性能表现、OpenAI 的 AGI 征途、到 Sora 革新娱乐方式,再到 AI 将如何干掉人类工作岗位等热议问题。Sam Altman 坚定地认为,根据科学预测,GPT-5 将比 GPT-4 智能得多,而 GPT-6 的智能又会远超 GPT-5。目前 OpenAI 还没有达到这个智能发展曲线的顶点。
讯飞星火大模型 V3.5 春季上新,V4.0 官宣 6 月 27 日发布
科大讯飞今日官宣,讯飞星火大模型 V3.5 春季上新,科大讯飞董事长刘庆峰发布讯飞星火大模型一系列新功能。刘庆峰表示,目前星火大模型通用长文本能力,包括长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等,总体已经达到 GPT-4 Turbo 今年 4 月最新长文本版本的 97% 的水平,而在多个垂直领域的知识问答任务上,星火大模型长文本总体水平已经超过 GPT-4 Turbo。
星尘智能发布自研AI机器人Astribot S1,操作性能强大
由腾讯RoboticsX机器人实验室的一号员工来杰创立的星尘智能宣布成功自研AI机器人Astribot S1,在同规格机器人中具备“最强操作性能”。S1通过模仿学习,能以媲美成年人的敏捷、灵活和丝滑度,执行多项对人有用的复杂任务,建立了新的AI机器人标准。S1机器人已接入大模型测试,并预计在2024年内完成商业化。
Sanctuary AI 推出第 7 代“Phoenix”人形机器人
类人智能通用机器人初创公司 Sanctuary AI 宣布推出第 7 代“Phoenix”机器人,相比上代机器人具有改进后的类似人类的运动范围;正常运行时间、视觉感知和触觉感知的改进提高了系统在较长时间内执行复杂任务的能力;设计迭代显着减少构建时间;新任务的自动化速度提高了 50 倍。
马斯克的xAI即将筹资60亿美元,红杉资本参投
据国外媒体报道,知情人士周四透露,埃隆·马斯克(Elon Musk)创办的人工智能初创企业xAI已接近完成新一轮融资。在本轮融资中,成立不到一年的xAI注资前估值达到180亿美元,共募集到60亿美元资金。据悉,xAI本轮融资预计会在未来两周内完成,包括红杉资本等多家风险投资公司参投。xAI的本轮融资规模也将比肩OpenAI、Anthropic等竞争对手,成为人工智能初创公司最大的单笔融资之一。
AI助力微软一季度财报全面超预期,云收入提速增长
微软发布了2024财年第三财季(即2024自然年一季度)财报,这是Copilot生成式AI助手推出后的首个完整季度财报,不仅令微软的利润同比增20%且环比也小幅上涨,还推动Azure云收入加速增长了31%,贡献的云收入增幅提升至7个百分点,都为华尔街所喜。CEO纳德拉称 ,一直在将合作伙伴OpenAI的人工智能技术融入到微软的整个产品线中。
百度:AI专利申请量、授权量位居国内第一
在第24个世界知识产权日来临之际,百度昨日举办“专利运用赋能AI产业高质量发展”论坛。在论坛上,百度首席技术官王海峰透露,百度在以大模型为核心的人工智能领域,其专利申请量和授权量在国内均位居第一,且在全球范围内处于领先地位。特别是在深度学习相关的专利申请量上,百度更是位居全球之首。
OpenAI 副总裁 Chris Lehane:人工智能是关键基础设施
OpenAI公司副总裁Chris Lehane在接受Axios独家采访时称,人工智能(AI)应被视为“关键基础设施”。Lehane认为,OpenAI的技术有助于解决医疗、教育和气候等重大社会问题,并将AI技术与“罗斯福新政”建造实体基础设施相提并论。他表示OpenAI现在“准备能够帮助公共部门设计、开发和思考人工智能作为一种资源,然后将其转化为关键基础设施”。OpenAI正寻求更多高层人才,以加强与全球决策者和社区的沟通。Lehane的加入预示着OpenAI在全球推广AI的雄心。
2024年4月25日·周四
通义千问APP上线基于EMO框架的照片唱歌功能,所有用户可免费使用
把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前,这款名为 EMO 的模型因为阿里通义实验室的一篇论文火遍海内外,模型的产品化进程也广受关注。如今,打开 通义千问APP ,进入“全民舞台”频道,就可来到EMO产品页面“全民唱演”。在歌曲、热梗、表情包中任选一款模板,上传肖像照片,EMO随即就能合成视频。通义APP首批上线了80多个EMO模板,包括热门歌曲《上春山》《野狼disco》等,网络热梗“钵钵鸡”“回手掏”等。
支付宝灰度测试智能助理,可提供多种办事服务
据量子位报道,支付宝正对一款AI智能助理进行灰度测试。不同于对话交流、辅助创作的常见大模型,该智能助理更偏向服务办事型的AI助手。根据其界面显示,可提供医疗问诊、查办公积金、买机票找厕所、推荐上映电影等办事指令。此外,它还能根据需求推荐支付宝的相应功能或直连小程序,起到App内的智能导航作用。
扎克伯格:生成式 AI 是长期投资,需数年才能产生回报
扎克伯格在 Meta 公司财报电话会议中表示,公司和投资者在生成式 AI 领域的投资,至少需要数年时间才能产生回报。财报显示,Meta 第一季度的营收为 364.55 亿美元,同比增长 27%;净利润为 123.69 亿美元,同比增长 117%;摊薄后每股收益达到 4.71 美元,同比增长 114%。由于 Meta 计划持续加大在人工智能领域的投资,并且其现实实验室(Reality Labs)依然在持续亏损,这导致 Meta 的股价在盘后交易中暴跌超过 16%。
英国监管机构:对微软和亚马逊的AI投资活动开启反垄断审查
英国竞争与市场管理局(CMA)周三(4月24日)对微软和亚马逊开启了一轮反垄断审查。CMA正在就微软与Mistral AI之间的人工智能合作关系、以及亚马逊与Anthropic之间的合作关系征求第三方意见。两家当事公司辩称,他们对这些初创公司的投资并非是合并。
阿里发布《“AI+”职业趋势报告》:“人机协作”成为新工作方式
阿里巴巴发布《“AI+”职业趋势报告》,报告指出,“人人都有一个AI助理”的时代加速到来,AI能力成为职场关键竞争力,“人机协作”成为新的工作方式。报告认为,面向AI时代的职场,AI能力是关键,AI助理则是个人和企业调用AI超强智能最简便、最普惠的方式。
OpenAI 收到英伟达全球首部 DGX H200 AI 超算
美东时间4月24日周三,OpenAI总裁兼联合创始人Greg Brockman在社交媒体X透露,英伟达向OpenAI移交全球第一部DGX H200,并附上在交付现场他和OpenAI CEO 奥特曼以及英伟达CEO黄仁勋的合照。Brockman称,这部黄仁勋倾力打造的设备“将推进AI、计算以及人类文明”。DGX H200是英伟达将多个Grace Hopper超级芯片互连到同一个GPU 中打造的新型AI 超算,拥有19.5TB 的海量共享 GPU 内存空间、900 GB的GPU到GPU 带宽、128 petaFLOPS的AI性能。
英伟达以约 7 亿美元收购 AI 基础设施编排和管理平台 Run:ai
GPU和AI芯片巨头NVIDIA英伟达正式宣布已与以色列人工智能初创公司Run:ai达成最终协议,将收购这家基于Kubernetes的工作负载管理和编排软件提供商。该交易的价值并未披露,但估计约为 7 亿美元。
2024年4月24日·周三
SK海力士计划投资146亿美元扩大芯片产能,以满足 AI 开发需求
SK海力士计划斥资约20万亿韩元(146亿美元)在韩国构建新的存储芯片产能,进行重大的产能升级,以满足快速增长的人工智能开发需求。这家韩国公司将初步拨出5.3万亿韩元,于4月底左右开始建设一家新工厂或晶圆厂,计划在2025年11月完工。根据声明,SK海力士将长期逐步发展该设施,总投资将超过20万亿韩元。
波士顿咨询发布AI调研报告:中国消费者AI认知度超过80%
波士顿咨询公司发布AI调研报告称,全球消费者正在以各种方式尝试使用AI以满足需求,体验维度包括舒适度、定制化和便利性。在其调查的国家中,消费者对AI的了解程度均高于预期:在印度和阿联酋,90%以上的消费者听说过ChatGPT;在中国和沙特阿拉伯,消费者的AI认知度超过80%。此外,75%的受访者使用过ChatGPT或其他AI驱动的服务。
消息称三星和 AMD 签署价值 4 万亿韩元的 HBM3E 12H 供货协议
根据韩媒 Bridge Economy 报道,三星和 AMD 公司签署了价值 4 万亿韩元(IT之家备注:当前约 210.8 亿元人民币)的 HBM3E 供货合同。报道称三星和 AMD 签署的这份合同中,AMD 采购三星的 HBM,而作为交换三星会采购 AMD 的 AI 加速卡,但具体换购数量目前尚不清楚。三星日前表示将于今年上半年量产 HBM3E 12H 内存,而 AMD 预估将会在今年下半年开始量产相关的 AI 加速卡。
华为发布新一代鸿蒙座舱:搭载千悟大模型,支持挥手控制
在今天的“华为智能汽车解决方案发布会”上,华为正式为大家带来新一代华为鸿蒙座舱,拥有智慧车机、智慧音响、智慧显示。据介绍,新一代华为鸿蒙座舱车载千悟大模型,拥有盘古大模型、MindS pore异思计算框架、异腾AI基础硬件平台硬件基础,打造200+Apps车机生态。
初创公司 Profluent 推出首个完全由 AI 设计的基因编辑器
初创公司Profluent宣布,完全由AI设计的基因编辑器,已经成功编辑了人类细胞中的DNA。也就是说,世界上首个使用AI从头设计的分子级精确基因编辑器诞生了。就像ChatGPT能生成诗歌一样,Profluent这个全新的AI系统,可以让我们编辑自己DNA的微观机制生成蓝图。在迄今最广泛的基于CRISPR的基因编辑系统数据集上,研究者训练了LLM。这些LLM产生的蛋白质,将几乎所有天然存在的CRISPR-Cas家族的多样性,扩大了4.8倍。
微软解锁 Copilot 特性:字符上限最高调至 1.6 万、支持梳理 PDF 等文件内容
微软公司近日通过服务器更新,上调了 Windows 10、Windows 11 系统、网页版以及 Edge 浏览器中 Copilot 的字符上限,最高可以达到 1.6 万个;此外微软还支持附加 PDF 等文件以及集成笔记本。
最早实现盈利的AIGC公司,出门问问今日成功登陆港交所
4月24日,历经二次递表的“AI独角兽”出门问问(2438.HK)成功在港交所挂牌。出门问问IPO定价为3.8港元/股,截至发稿,出门问问报于每股3.1港元,总市值46.24亿港元。作为全球率先盈利的⼤模型公司,出⻔问问的港股IPO,也意味着其成为了2024年的“AIGC第⼀股”。出门问问是一家以AIGC与语音交互技术为核心的大模型公司,主要有AIGC解决方案、AI企业解决方案、智能设备及配件等三大业务板块,已推出多模态大模型“序列猴子”,并应用于旗下 魔音工坊 、 奇妙元 、 奇妙问 等产品。
马斯克:可能在明年年底前出售特斯拉人形机器人 Optimus
特斯拉 CEO 马斯克在财报电话会议上表示,预计在今年底之前,特斯拉的 Optimus 人形机器人将拥有完成“有用的”工厂任务的能力,该公司可能会在 2025 年底前将其对外销售,特斯拉计划今年年底前在其自家工厂率先使用该机器人。
AI 视频大模型初创公司「爱诗科技」获超亿元 A2 轮融资,蚂蚁集团领投
近日,AI 视频生成初创公司爱诗科技( PixVerse )完成 A2 轮超亿元融资,由蚂蚁集团领投,光源资本担任独家财务顾问。至此,爱诗科技一年内累计获得融资超2亿人民币,成为中国视频大模型领域融资规模最大的创业公司。
消息称 AI 搜索初创公司 Perplexity 正寻求筹集至少 2.5 亿美元新一轮融资,估值 25 到 30 亿美元
据 TechCrunch 报道,人工智能搜索引擎初创公司 Perplexity 目前正在筹集至少 2.5 亿美元的新一轮资金,估值在 25 亿至 30 亿美元之间。早些时候,Perplexity 创始人在 X 上表示该公司已完成了 6300 万美元的融资,估值超 10 亿美元。但多个消息来源表示,该公司实际上还在筹集新一轮资金,以利用其在市场上获得的关注。据消息人士透露,NEA 和 IVP 都是该公司之前的支持者,他们也希望在这一轮更大规模的投资中进行投资。
消息称苹果正在为AI服务器开发自己的定制Apple Silicon芯片
消息称苹果公司正在使用台积电的3 纳米工艺开发自己的人工智能服务器处理器,目标是在 2025 年下半年实现量产。消息来源于自称在集成电路行业拥有 25 年经验的微博账户“手机晶片达人”,这款处理器将采用台积电的 3nm 节点制造。
AI 搜索初创公司 Perplexity 获新一轮 6300 万美元融资,估值升至逾 10 亿美元
谷歌的竞争对手、美国人工智能搜索公司 Perplexity AI 在新一轮融资中筹集了约6300万美元,估值超过10亿美元。这笔融资于周二宣布,使Perplexity的估值较三个月前翻了一番。投资者Daniel Gross领投,亿万富翁Stanley Druckenmiller、Y Combinator首席执行官Garry Tan和Figma Inc.首席执行官Dylan Field参与了这轮融资。另外,包括亚马逊创始人杰夫·贝佐斯和英伟达在内的几位Perplexity早期投资者也加入了这轮融资。
2024年4月23日·周二
Adobe Photoshop 引入全新 Firefly Image 3 图像 AI 模型,Beta 版开放下载
今天,Adobe 宣布推出新版 Photoshop,不仅包含一些新的 AI 图像编辑功能和改进,还包含新的 Firefly Image 3 Foundation Model,用于根据文本提示制作基于 AI 的内容。Adobe 在官方新闻稿中表示,与之前的版本相比,Firefly Image 3 将能够创建质量更高、种类更多、细节更丰富的图像,它还能更好地理解文本提示。
商汤科技发布日日新5.0大模型,对标GPT-4 Turbo
4月23日,商汤科技在中国北京举行新品发布会,正式发布人工智能大模型“日日新5.0”。该模型采用了先进的MOE(Mixture of Experts)混合专家架构,并基于超过10TB的数据tokens进行深度学习训练。此外,日日新5.0大模型还拥有高达200K的推理上下文窗口。据悉,日日新5.0大模型的开发旨在全面对标OpenAI的GPT-4Turbo。
越南科技巨头FPT将与英伟达合作,投资2亿美元建“人工智能工厂”
越南科技巨头FPT与英伟达4月23日宣布达成全面战略合作,计划投资2亿美元、利用英伟达的技术建造“人工智能工厂”,促进AI研究并为越南和全球客户提供服务与解决方案。声明称,英伟达将帮助FPT在汽车和数字化转型等领域开发AI技术。
月之暗面回应创始人杨植麟套现数千万美元:消息不实
针对上一轮融资完成后,月之暗面(Moonshot AI)创始人杨植麟通过售出个人持股已套现数千万美金的消息,月之暗面回应称:上述消息不实,月之暗面此前已公布员工激励计划,可见官方信息。
月之暗面创始人杨植麟套现数千万美金
据界面新闻报道,上一轮融资完成后,月之暗面(Moonshot AI)创始人杨植麟通过售出个人持股已套现数千万美金。有知情人士表示,月之暗面最近这轮融资涉及一些老股交易,但红杉等老股东都没有出售股份。“有传言创始人及相关人员套现金额在4000万美金。”另有业内投资人表示,“公司成立第一年就套现这么多,这种情况并不多见。”
全国首例 AI 声音侵权案一审宣判,原告配音师获赔 25 万元
据央视新闻消息,北京互联网法院今天上午对全国首例“AI 声音侵权案”进行一审宣判,认定作为配音师的原告,其声音权益及于案涉 AI 声音,被告方使用原告声音、开发案涉 AI 文本转语音产品未获得合法授权,构成侵权,书面赔礼道歉,并赔偿原告各项损失 25 万元。
微软招揽前 Meta 高管,增强其人工智能超级计算团队实力
微软正通过招募行业人才来加强其人工智能超级计算团队的实力。周一,微软首席技术官 Kevin Scott 在领英上发帖宣布,前 Meta 高管 Jason Taylor 将加入微软,担任企业副总裁兼 CTO 副手,帮助公司“构建下一代系统,推动人工智能前沿的发展”。
Meta向硬件厂商开放VR/AR操作系统授权,联想、华硕加盟
据国外媒体报道,Facebook母公司Meta周一宣布,将向第三方硬件厂商开放VR/AR操作系统Meta Horizon OS。包括联想、微软和华硕等公司,将成为首批采用该操作系统开发硬件的厂商。
苹果收购法国初创公司 Datakalab 以增强 iPhone AI 功能
近日,苹果公司再次扩大了其在人工智能领域的布局,收购了一家名为Datakalab的法国初创公司。据法国商业杂志《Challenges》报道,这笔收购于2023年12月完成,进一步印证了苹果在AI技术方面的雄心壮志。Datakalab是一家专注于“算法压缩和嵌入式人工智能”的初创企业,这与苹果公司一贯推崇的在设备端运行AI的理念高度契合。
微软 CEO 纳德拉:若没有微软早期支持,OpenAI 就不会存在
据外媒 Benzinga 当地时间周一报道,微软公司首席执行官萨蒂亚・纳德拉(Satya Nadella)近期接受采访,强调了微软在领先的人工智能公司 OpenAI 的发展中所发挥的“关键作用”。“如果没有我们的早期支持,OpenAI 就不会存在。如今,他们已成为一家令人难以置信的公司,能参与他们的发展历程也使我们与有荣焉。”纳德拉如是说。纳德拉还讨论了更广泛的 AI 领域,并称主要的科技公司之间存在“良性竞争”,为全球进步创造重要机会。
2024年4月22日·周一
腾讯旗下协作SaaS产品全面接入混元大模型,实现智能化升级
4 月 22 日,腾讯宣布旗下协作 SaaS 产品全面接入腾讯混元大模型,除企业微信、腾讯会议、腾讯文档等 “一门三杰” 产品,腾讯乐享、腾讯电子签、腾讯问卷、腾讯云 AI 代码助手等协作 SaaS 产品也都已实现智能化升级。
软银据悉将斥资1500亿日元增强人工智能算力
据日经新闻报道,软银将准备开发生成式AI所需的计算设备。到2025年,软银将投资1500亿日元(注:最新汇率约合人民币70.2亿元)开发配备高性能半导体的基础设施,将把算力提高到目前水平的几十倍。
智谱 AI 旗下 AMiner 开放数据平台发布《全球十个大模型核心团队成员分析报告》
智谱 AI 旗下 AMiner 开放数据平台发布了《全球十个大模型核心团队成员分析报告》,旨在为大模型领域的相关人员在今后的研究交流、人才引进提供参考。该报告结合当下模型知名度和专家建议选取了全球十个大模型(GPT、Gemini、Claude、GLM、LLaMA、Qwen、Falcon、PaLM、BERT、T5),从地域分布、年龄结构、教育背景、华人占比和学术影响力 5 个维度进行全面分析,揭示了十个大模型核心成员的人才现状。报告显示,华人在大模型领域具有一定竞争力,在挑选的国外(除 GLM、Qwen)大模型团队成员 899 人中,华人成员共计 167 位占比达 18.7%。
IPRdaily 发布中国人工智能发明专利企业排行榜,腾讯第一、百度第二
IPRdaily中文网发布“中国人工智能发明专利企业排行榜(TOP50)”,根据榜单显示:腾讯以15626件发明专利排名第一;百度以13723件发明专利排名第二;平安集团以13139件发明专利排名第三。此外,国家电网、华为、蚂蚁集团、阿里巴巴、京东集团、OPPO、中国移动等企业也表现突出,位列前十。注:统计数据基于人工智能技术相关的关键词和分类号进行限定,统计2014年4月1日至2024年3月31日在中国申请并公开的人工智能发明专利(同申请号合并)
黄仁勋:AI 促使能耗成本降10倍,未来所有人都将构建人形机器人
近期在美国举行的CadenceLIVE Silicon Valley 2024上,英伟达CEO黄仁勋(Jensen Huang)院士与Cadence 总裁兼CEO阿尼鲁德·德夫甘(Anirudh Devgan)进行一场炉边对话。黄仁勋表示:“AI 实际上帮助人们节省能源。如果不是因为你创建的 AI 模型,如果没有 AI,我们怎么能节省6倍或10倍的成本呢?” 他还预测,在不久的将来,我们所有人都将建造全新类别的设备是“人形机器人”,并表示人形机器人的制造成本可能比人们预期的要低得多。
阿里云宣布全方位支持Llama 3训练推理,并提供免费算力
近日,Meta开源最新 Llama 3 系列,阿里云魔搭社区第一时间上架全部4款模型。今天,阿里云百炼大模型服务平台宣布推出针对Llama 3系列的限时免费训练、部署、推理服务,企业和开发者即日起即可在阿里云上基于其打造自己的专属大模型。
古尔曼:苹果正自研设备端大型语言模型,赋能 AI 功能
据彭博社记者马克・古尔曼 (Mark Gurman) 报道,苹果公司正在研发一种运行于设备端的大型语言模型 (LLM) ,旨在提升即将发布的生成式 AI 功能的响应速度和隐私保护能力。
英国剑桥大学研究人员利用 AI 将帕金森病药物设计提速十倍
英国剑桥大学研究人员使用人工智能(AI)技术大幅加快了帕金森病治疗方法的开发。他们设计并使用了一种基于AI的策略,来识别阻止α-突触核蛋白(帕金森病的特征蛋白)聚集的小分子。利用AI技术,研究人员将初始筛查过程加快了10倍,并将成本缩减至千分之一,这意味着研发出帕金森病潜在疗法的速度要快很多。研究结果发表在新一期《自然·化学生物学》杂志上。
2024年4月20日·周六
上海交通大学人工智能学院揭牌成立并将与华为等九家单位进行校企合作
今日,上海交通大学人工智能学院揭牌成立。上海交大已经成为AI创业者们的“摇篮”,部分头部AI企业创始人均来自于此。上海交大还与华为、科大讯飞、商汤科技、云从科技、云天励飞、壁仞科技、第四范式等9家机构签署战略合作协议。
英伟达市值一夜暴降1.5万亿,美国担心 AI 热潮熄火
新一轮 AI 热潮似乎出现“熄火”迹象。截至美股周五收盘,“一年十倍股”的 AI 服务器龙头超微电脑股价一夜暴跌超20%,最新收跌23%,创两个多月新低。同时,英伟达股价下跌10%,是自2020年3月以来股价最低的一天,一夜之间市值蒸发超过2100亿美元(约合人民币1.52万亿元)。过去一周内,英伟达市值蒸发近3000亿美元——大约相当于一个AMD(2370亿美元)、2个英特尔(1455.85亿美元)、1.8个宁德时代(8393.37亿元)。
扎克伯格最新采访:Meta最强开源模型Llama 3凭什么值百亿美金
在 Meta 发布 Llama 3 的重要时刻,该公司首席执行官马克·扎克伯格(Mark Zuckerberg)接受了知名科技播客主持人达瓦克什·帕特尔(Dwarkesh Patel)的专访。他们围绕Llama 3、通用人工智能(AGI)、能源瓶颈问题、人工智能技术的战略意义、开源的潜在风险、元宇宙(Metaverse)等话题展开了深入的探讨。同时,扎克伯格还分享了开源100亿美元模型和定制芯片源代码的决策过程。
2024年4月19日·周五
Meta 开源推出新一代大语言模型 Llama 3
Meta 公司今日凌晨宣布最新开源推出新一代大型语言模型(LLM)—— Llama 3 ,包含 8B 和 70B 两种参数规模的模型(400B模型还在训练中),标志着开源人工智能领域的又一重大进步。作为 Llama 系列的第三代产品,Llama 3 不仅继承了前代模型的强大功能,还通过一系列创新和改进,提供了更高效、更可靠的AI解决方案。此外,Meta 还宣布推出基于 Llama 3 的 Meta AI 聊天助手。
来源: Meta
SK海力士、台积电宣布合作开发HBM4芯片,预期2026年投产
当地时间周五,SK海力士与台积电发布公告,宣布两家公司就整合HBM和逻辑层先进封装技术签订谅解备忘录。双方将合作开发第六代HBM产品(HBM4),预计在2026年投产。
百度文库全面上新智能漫画、智能画本功能
近期,百度文库发布“跨模态AI漫画及画本生产能力”,用户只需要一句话就可以实现分钟级创作,打通从创意激发到内容生成的全链路创作路径,用户还能通过作品发布、分享获取收益、兼职赚钱。在Create2024百度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏也全面展示了 百度文库AI 全新推出的智能漫画、智能画本功能。
谷歌将对其人工智能(AI)团队进行结构性改革
谷歌母公司Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)周四表示,谷歌正在对其人工智能(AI)团队进行结构性改革,并称此举将有助于公司更快、更有效地开发人工智能产品和服务。为了加快谷歌AI模型(Gemini和Gemma)的研发工作,皮查伊在周四发给员工的一份通知中表示,构建模型、研究和负责任的人工智能团队将被整合谷歌DeepMind之下。这将把上述部门的员工联合到一个团队,也将把训练和构建这些系统所需的昂贵计算能力整合到一个部门。
人工智能初创公司 Stability AI 宣布裁员 10%
在备受争议的前CEO Emad Mostaque离职后,四面楚歌的AI初创公司Stability AI今日宣布裁员10%。一份内部备忘录显示,在经历了一段不可持续的增长后,Stability AI裁减了20多名员工,以适当调整业务规模。Stability AI新任命的联席CEO Shan Shan Wong和Christian Laforte在一封电子邮件中称:“公司需要重组部分业务,这意味着将不得不与一些同事告别。”两位CEO还称:“我们已经通知了受此影响的员工,我们将在整个期间为他们提供支持。”
OpenAI 旗下的 DALL-E 2 将不再接受新用户购买
2022年4月6日,OpenAI推出了AI图像生成器DALL-E 2,能够根据文本描述生成逼真图像,引发技术革新和伦理辩论。随着技术进步和 DALL-E 3的推出,OpenAI于近期停止了DALL-E 2的新用户购买服务,标志着一个时代的结束。
Nothing 推出新款 Ear 系列无线耳机,支持 ChatGPT 对话
由一加联合创始人裴宇创办的 Nothing 公司宣布将 ChatGPT 更深入地整合到其智能手机和耳机中,让用户能更快捷地使用这一全球热门的AI服务。从4月18日起,Nothing Phone 2 用户在手机上安装了最新 Nothing OS 和 ChatGPT 将能通过 Nothing Ear 和 Ear(a) 耳机唤起 ChatGPT 进行对话。未来几周,Phone 1 和 Phone 2A也将跟进。
2024年4月18日·周四
甲骨文十年内将在日本投资逾80亿美元用于云计算和AI
美国软件巨头甲骨文公司周三宣布,计划未来10年在日本投资逾80亿美元,以满足当地对云计算和人工智能(AI)基础设施不断增长的需求。根据官方新闻稿,这笔投资将扩大甲骨文云基础设施(OCI)业务在日本的覆盖范围,并大幅扩大其运营和支持工程团队,以帮助客户和合作伙伴满足日本的数字主权需求。自去年12月以来,包括英伟达、亚马逊、微软和OpenAI在内的科技公司都宣布了在日本的拓展计划。
日本政府拟出资超700亿日元支持多家日企建AI超算,以减少对美国技术依赖
日本经济产业省将向5家日本企业提供总额725亿日元(约合4.7亿美元)的补贴,用于打造人工智能超级计算机,旨在减少对美国的技术依赖。据悉,Sakura Internet、日本电信巨头 KDDI、GMO互联网、Rutilea和Highreso将分别获得501亿、102亿、19亿、25亿和77亿日元的政府补贴。
月之暗面 Kimi 智能助手升级:支持新模型、搜索结果溯源
月之暗面官宣,旗下 Kimi智能助手 更新:模型能力提升,更稳的基座能力;支持 Kimi 常用语,内置官方提示词;新增支持语音输入、输出 、 播报;支持搜索引用溯源。
AI芯片需求继续强劲,台积电Q1净利润一年来首次增长
在强劲的AI芯片需求提振下,全球最大芯片代工厂台积电一季度净利润好于预期,实现一年以来首次增长。财报显示,台积电一季度净利润为2255亿元台币(约合69.76亿美元),预估2149.1亿元台币,同比增长8.9%;第一季度销售额5926.4亿元台币(约合183.33亿美元),同比增长17%,预估5834.6亿元台币。第一季度营业利润2490.2亿元台币(约合77亿美元),同比增长7.7%,预估2408.7亿元台币。
Mobileye 创始人初创公司 Mentee Robotics 展示 AI 人形机器人
MenteeBot 由 Mobileye 和 AI21 Labs 的创始人联合成立的初创公司 Mentee Robotics 展示了旗下首款人形机器人的原型 Menteebot,号称在所有操作层都接入了AI,是“可以被指导的”个性化AI机器人。Mentee Robotics已经完成融资1700万美元,由Ahren Innovation Capital领投。综合该公司的介绍,感知和推理是推动这款机器人发展的两个关键支柱,这依托于计算机视觉和生成式AI。
钉钉上线AI助理市场,200+AI助理覆盖办公、生活与娱乐场景
钉钉正式上线AI助理市场(AI Agent Store),首批将推出超过200个AI助理,覆盖企业服务、行业应用、效率工具、财税法务、教育学习、生活娱乐等类目,用友、携程商旅、墨见Molook等各领域SaaS企业已上架AI助理,加入钉钉AI生态。
Meta 的 Llama 2 大模型被指安全性低,13 项测试仅通过 4 项
AI 安全公司 DeepKeep 近日发布评估报告,在 13 个风险评估类别中,Meta 公司的 Llama 2 大语言模型仅通过 4 项测试。报告称 70 亿参数的 Llama 2 7B 模型幻觉(回答内容存在虚假,或者有误导性内容)最为严重,幻觉率高达 48%。
联想首批“硬件+端云结合AI”的 AI PC 产品正式发布
联想在上海举行科技创新大会Tech World,在首日上午的主题演讲中,联想集团董事长兼CEO杨元庆宣布联想首个严格意义上“硬件+端云结合AI”的AIPC产品正式发布。大会上,联想首批共宣布了Yoga Book AI元启版、 Yoga Pro 16s AI元启版、ThinkPad T14p AI元启版、ThinkBook 16p AI元启版、Yoga Air 14 AI元启版、小新 Pro 16 AI元启版六款AI PC新品。
高通 CEO 安蒙:混合 AI 是 AI 的未来
第十届联想创新科技大会Tech World在上海举行。高通公司总裁兼CEO安蒙表示,混合AI是AI的未来。混合AI可在终端侧和云端同时利用AI,通过高性能连接分配和协调工作负载,从而带来更加智能的个性化用户体验。当云端和终端使用相同的生成式AI模型时,终端可以为云端带来先发优势。终端侧数据还能提升AI应用的精准度,因为其现在掌握了用户的情境信息。
消息称微软计划到年底积累180万枚AI芯片,将其GPU数量增加两倍
根据媒体看到的一份内部文件,微软的目标是到2024年底积累180万枚人工智能芯片。微软正试图让生成式AI更快、更好、更便宜,但这一努力在很大程度上依赖于微软采购芯片和图形处理单元(GPU),这些芯片主要来自英伟达。这份文件显示,微软计划在2024年将其拥有的GPU数量增加两倍。据两位知情人士称,从当前财年到2027财年,微软预计将在GPU和数据中心上花费约1000亿美元。
英特尔推出全球最大神经拟态系统,比人脑快200倍
今日凌晨,美国芯片巨头英特尔(Intel)宣布,其打造出全球最大的神经拟态系统——Hala Point,旨在支持未来类脑 AI 研究,解决 AI 目前在效率和可持续性等方面的挑战。具体来说,Hala Point内置1152个、基于Intel 4(7nm)制程的英特尔Loihi 2处理器,支持多达11.5亿个神经元和1280亿个突触,每秒可处理超过380万亿个8位突触和超过 240 万亿个神经元操作,相关系统最初部署在美国桑迪亚国家实验室。应用于仿生尖峰神经网络模型时,在运行神经元数量较低的情况下,Hala Point速度可比人脑快200倍(20000%)。
波士顿动力推出全电动化人形机器人 Atlas
就在业界还在为波士顿动力停止开发液压机器人Atlas疑惑不解之际,一天之后,该公司揭露了真相:Atlas将进入全新的电动化时代。波士顿动力声称最新的Atlas是为了现实世界的应用而设计的,并称Atlas是世界上最活力的人形机器人。周三发布的一段视频显示,新的Atlas机器人在设计上与以往版本截然不同,拥有更轻巧的机械骨架和更平滑的动作,如可以从地面自行站立,头部可以180度旋转,其灵活性确实无与伦比。且电动Atlas机器人比前身更具科技感,外观更轻便、简洁,头部设计为功能性圆形屏幕,没有人脸特征。
微软对 OpenAI 的巨额投资据悉不会遭到欧盟调查
微软公司对OpenAI公司130亿美元的投资将避免受到欧盟兼并监管机构的正式调查,从而平息了人们对双方关系可能被迫破裂的担忧。知情人士透露,欧盟委员会已经决定,这一合作不值得进行正式调查,因为不属于收购,而且微软并不控制OpenAI的发展方向。
Stability AI 现已通过 API 向开发人员提供其文生图模型 Stable Diffusion 3
新一代文本到图像 AI 模型 Stable Diffusion 3 仍处于预览阶段,但 Stability AI 正在通过 API 和新的内容创建平台向一些开发人员提供该模型。Stability AI 表示,开发人员现在可以从其开发人员平台访问 Stable Diffusion 3。
美团抖音下注新战场:内测外卖助手“问小袋”,成立生活服务AI团队
据Tech星球报道,美团于近日测试了面向C端用户的AI助手服务“问小袋”,类似于电商平台的AI导购功能,可为用户推荐符合其需求的外卖商品,以及用餐建议。目前,AI助手服务“问小袋”已在美团外卖平台中开启小范围测试。抖音生活服务也在试水AI在本地生活场景的布局,据了解,抖音生活服务成立了一支AI团队,该部门成立的目的是利用AI技术,为抖音生活服务创造增量业务价值,并且已开启对相关AI产品的研发,包括搭建生活服务相关的内容创作平台等。
2024年4月17日·周三
报告预测今年我国AIGC应用市场规模将达到200亿,2030年将达万亿元
4月17日,《中国AIGC应用全景报告》在北京举行的中国AIGC产业峰会上发布。报告预测,2024年我国AIGC应用市场规模将达到200亿,到2026年,中国AI市场规模将达千亿级别。2030年,我国AIGC应用将成为万亿规模市场,未来五年(2024-2028年)平均复合增长率超过30%。
法国AI独角兽Mistral AI寻求新一轮融资,目标50亿美元估值
据媒体援引知情人士的消息报道,法国科技初创公司Mistral AI正在与投资者接洽,希望以50亿美元的估值再进行一轮数亿美元的融资。不过这位知情人士称,目前尚不清楚Mistral AI与哪些投资者谈过新一轮融资事项。Mistral AI成立于2023年5月,三位创始人曾分布在谷歌Deepmind和Meta平台任职。去年12月,Mistral AI筹集了4.15亿美元,当时的投资者包括赛富时和英伟达,融资完成后,Mistral的估值达到了20亿欧元。
Chrome 浏览器桌面版地址栏即将整合聊天机器人 Gemini
桌面端 Chrome 浏览器地址栏即将添加 Gemini 快捷方式,用户在 Gemini 网页上登录账户后,用户只需输入 @gemini 即可快速与谷歌的人工智能聊天机器人 Gemini 开始聊天。该功能目前正在 Chrome 浏览器 Canary 测试版中进行测试,地址栏下拉菜单底部会出现提醒,“输入 @gemini 与 Gemini 聊天”。
国内首个“AI评标师”已上岗:有望每年为央国企节约采购成本超5400亿
根据媒体报道,以国家能源集团为例,近期上线的智能无人评审系统通过运用AI技术进行采购场景创新,使得智能评审准确率大幅提升。这一举措不仅体现了央国企在供应商管理方面的全面加强,也展示了数字化智能化采购交易管控体系的完善,为企业节约了大量的经营成本。据数据显示,2022年全年节约采购成本超过5400亿元,AI在其中扮演了至关重要的角色。
OpenAI、蚂蚁集团、谷歌、科大讯飞等联合编制大模型安全国际标准正式发布
在瑞士举行的第27届联合国科技大会上,世界数字技术院(WDTA)发布了《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准,是由OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同编制而成。
MiniMax 发布万亿 MoE 模型 abab 6.5
MiniMax 今日宣布正式推出 abab 6.5 系列模型,该系列包含两个模型:abab 6.5 和 abab 6.5s。abab 6.5 包含万亿参数,支持 200k tokens 的上下文长度;abab 6.5s 跟 abab 6.5 使用了同样的训练技术和数据,但是更高效,支持 200k tokens 的上下文长度,可以 1 秒内处理近 3 万字的文本。在各类核心能力测试中,abab 6.5开始接近 GPT-4、 Claude-3、 Gemini-1.5 等世界上最领先的大语言模型。
昆仑万维旗下天工SkyMusic音乐大模型开启免费公测
昆仑万维今日宣布,天工 3.0 大模型性能提升显著,旗下的 天工SkyMusic 音乐大模型也在今日面向全社会开放公测。昆仑万维表示天工 SkyMusic 在人声 & BGM 音质、人声自然度、发音可懂度等领域“显著”领先对手,综合性能超越 Suno V3,取得音乐大模型 SOTA(State of the art model,即在当前研究中表现最好的模型)。
阿里开源推出代码大模型CodeQwen1.5,支持92种编程语言
阿里通义千问团队推出 CodeQwen1.5 ,一个基于 Qwen 语言模型的开源代码专家模型,拥有 7B 参数,支持 92 种编程语言,并且能够处理最长 64K 的上下文输入。该模型在代码生成、长序列建模、代码修改和 SQL 能力等方面展现出了卓越的性能,在多个基准测试中表现出色,包括 HumanEval、MBPP 和 LiveCodeBench,领先一众开源代码大模型甚至部分能力超越GPT-3.5-Turbo。
百度推出文心智能体平台,无/低代码快速构建智能体
在Create 2024百度 AI开发者大会上,百度推出 文心智能体平台 。百度搜索总经理赵世奇表示,2024年模型应用即将要开花结果,但光有大模型还是不够,需要有一个平台让大家方便使用大模型的能力,让每个人都可以开发自己的智能体。
黄仁勋最新访谈:GPU性能的革命性提升与AI未来
近期,英伟达CEO黄仁勋与美国CNBC知名主持人、股评人吉姆·克莱默(Jim Cramer)在《Mad Money》节目中展开了一场关于技术未来和人工智能的对话。访谈里,黄仁勋不仅提到了英伟达在过去八年中将AI算力性能提高1000倍,还预言了机器人将如何成为我们的“新同事”。在此次访谈后,克莱默表示,黄仁勋是一个比马斯克更有远见的人,是有史以来最伟大的CEO之一。
波士顿动力公司宣布将退役其人形机器人 Atlas
据外媒消息,近日,波士顿动力公司宣布,其备受瞩目的人形机器人Atlas即将结束其长达11年的服务生涯,被送往所谓的“机器人养老院”。这款由DARPA资助的机器人,在设计之初便以执行搜索和救援任务为目标,旨在进入对人类不安全的区域执行多样化任务。然而,Atlas因其流畅的舞蹈动作、惊人的力量、敏捷性和平衡能力,成为了公众眼中的明星。
AMD 发布新一代 AI PC 芯片锐龙Pro 8040/8000系列
美东时间周二,美国芯片设计公司AMD推出了新的处理器,用于驱动AI PC,试图在与英伟达和英特尔的竞争中取得领先地位。AMD将这些处理器称为迄今为止最强大的商用PC芯片,包括针对笔记本电脑的锐龙PRO 8040系列处理器和面向台式机的锐龙PRO 8000系列处理器,它们都采用了先进的4纳米制程技术。据悉,这些新的AMD芯片将从2024年第二季度开始,为包括惠普和联想等品牌的PC机型提供支持。
百川智能进行数亿美元融资?公司回应:金额并不准确
据媒体报道,由王小川创立的百川智能进行新一轮数亿美元融资,将成为国内2024年最大AI领域融资之一。来自参与的投资人证实,百川智能今年以来估值已超18亿美元,约合人民币130亿元。对此,新浪科技向百川智能方面求证,百川智能方面回应表示,“公司并未对外披露过最新融资信息,报道中涉及的金额也并不准确。”
2024年4月16日·周二
蚂蚁数科发布反深伪产品ZOLOZ Deeper
今日,深度伪造(Deepfake)综合防控产品ZOLOZ Deeper 正式发布,以拦截用户刷脸过程中的“AI换脸”风险,目前已率先应用在身份安全领域。公开资料显示,ZOLOZ是蚂蚁数科的科技品牌,以生物识别技术见长,历经支付宝App等大规模场景验证。
微软将向阿联酋AI公司G42投资15亿美元并持有少数股权
微软周二在一份声明中表示,该公司将向总部位于阿联酋的人工智能公司G42投资15亿美元,让这家美国科技巨头获得G42的少数股权和董事会席位。根据合作伙伴关系,G42将在微软的云计算平台Azure上运行其人工智能应用和服务,为全球公共部门客户和大型企业提供先进的人工智能解决方案。两家公司将共同努力,为中东、中亚和非洲国家带来先进的人工智能和数字基础设施。
DeepMind CEO:谷歌将在AI上投入超过1000亿美元
据媒体报道,谷歌旗下AI研究部门DeepMind首席执行官Demis Hassabis当地时间周一在温哥华举行的TED大会上表示,随着时间的推移,谷歌将花费超过1000亿美元开发人工智能技术。Hassabis没有透露更细节的投资规模,但表示:我们不谈具体数字,但我想随着时间推移,我们的投入会超过这个数。
OpenAI CEO和COO首次合体对话:地缘政治和社会经济的不稳定性,是限制AI发展的根本原因
4月16日凌晨,20VC with Harry Stebbings博客公布OpenAI联合创始人兼CEO奥尔特曼(Sam Altman)和OpenAI公司COO(首席运营官)布拉德·莱特凯普(Brad Lightcap)联合对话视频,时长约1小时左右。这是OpenAI公司成立8年多以来,奥尔特曼和布拉德·莱特凯普首次合体进行对外交流。此次交流中,对于当前OpenAI的担忧,奥尔特曼表示,如今,包括地缘政治、社会经济等宏观经济方面比任何时候都更不稳定,这是限制 AI 发展的关键所在,或是根本原因。
OpenAI 推出 Batch 批处理 API:半价折扣,24 小时内输出结果
OpenAI 今天凌晨面向开发者推出 Batch 批处理 API,可在 24 小时内给出结果,并提供 API 半价折扣。新的 Batch API 适用于异步任务处理,如当开发者需要处理大量文本、图片、摘要时,就可以使用该 API,OpenAI 会在 24 小时内给出处理结果。这样 OpenAI 可以在非高峰期处理,节约服务器资源,并为开发者提供半价优惠,解锁更高的速率限制。
百度发布“全球首个 AI 原生操作系统”DuerOS X,用于小度音箱等
在今日举行的 Create 2024 百度 AI 开发者大会上,小度科技宣布推出“全球首个 AI 原生操作系统”DuerOS X。据介绍,该系统基于百度文心大模型进行了全面升级,在多模态感知和拟人化呈现方面有了“重要突破”。通过 DuerOS X,小度的人机交互体验将实现“质的飞跃”,为用户提供更加自然、智能的交互方式。
百度发布新一代智能计算操作系统——万源
在今天的2024百度Create AI开发者大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖宣布,百度新一代智能计算操作系统——万源正式发布。据介绍,在内核层面,万源可将现有的算力资源发挥到极致,并且能自由选择不同芯片组合。万源的大模型既包含了业界领先的ERNIE 4.0、3.5大语言模型、也包括ERNIE Speed/Lite/Tiny系列轻量模型。
百度李彦宏:文心一言用户数突破 2 亿,API 日均调用量突破 2 亿
百度创始人、董事长兼首席执行官李彦宏在 Create 2024 百度 AI 开发者大会上透露,文心一言从去年 3 月 16 日发布,到今天是一年零一个月的时间,用户数突破了 2 亿,API 日均调用量也突破了 2 亿,服务客户数达到了 8.5 万,利用千帆平台开发的 AI 原生应用数超过了 19 万。
英国筹备立法加强对AI语言模型监管,预计法案将于近期推出
英国已开始着手制定严格监管人工智能的立法,特别是针对那些强大的语言模型,如支持OpenAI的ChatGPT的模型。报道称,英国政府可能会在今年晚些时候或2025年初,在法国举行的一场人工智能会议后推出这项法案。根据报道,英国科学、创新和技术部(DSIT)正处于立法的初期阶段,此举旨在防止人工智能可能对用户造成的潜在伤害。
全球最大对冲基金桥水已使用 AI 进行投资
全球最大对冲基金桥水日前向美国证监会提交的信息披露材料显示,它已在投资中使用人工智能。桥水分析了人工智能为投资带来便利的同时存在的风险。例如,AI 用于基本面分析时,存在出错的风险。桥水谈到了AI 可能会出现的问题之一:人工幻觉(AI Hallucination),即人工智能捏造数据,并使捏造的数据看起来像真的一样。数据显示,截至2023年12月31日,桥水以全权委托方式管理的客户资产规模为1125亿美元。
斯坦福李飞飞团队发布《2024年人工智能指数报告》
由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了 《2024 年人工智能指数报告》 (Artificial Intelligence Index Report 2024)。这份长达 300 多页的报告是 Stanford HAI 发布的第 7 份 AI Index 研究,追踪了 2023 年全球人工智能的发展趋势。Stanford HAI 官方介绍道,“这是我们迄今为止最全面的报告,而且是在人工智能对社会的影响从未如此明显的重要时刻发布的。”
Adobe Premiere Pro 将引入生成式 AI 视频并计划集成第三方
AI 模型 Adobe 预览了其生成式 AI 视频工具,有望重新定义视频创作和制作工作流程。这些工具专为 Adobe Premiere Pro 视频编辑软件设计,使用户能够添加或删除场景中的对象,并将与 Adobe 的 Firefly 生成 AI 模型一起使用。Adobe 还宣布计划将第三方生成式 AI 模型(如Runway、OpenAI、Pika等的模型)直接引入其应用程序(包括 Premiere Pro),不过目前时间表还不清楚。
AI 初创公司 Limitless 推出用于会议场景的可穿戴 AI 硬件
AI 初创公司 Limitless 推出一款名为 Limitless Pendant 的新型AI穿戴设备,旨在通过录音和AI辅助帮助用户更好地记忆和理解会议内容。作为Limitless系统的一部分,该设备可以连接到用户的电脑、邮件和日历,提供实时笔记、会议转录和会议摘要等功能。虽然目前市场上已有多种会议辅助工具,但Limitless Pendant以其独特的穿戴形式和对现实世界音频的优化,预计将在8月发售,售价99美元,有望改变用户处理会议信息的方式。
2024年4月15日·周一
OpenAI计划在日本半导体行业寻求合作伙伴,以采购高性能芯片
OpenAI首席运营官布拉德·莱特凯普接受采访称,该公司将在日本半导体行业寻求合作伙伴,以采购人工智能所需的高性能芯片。当日早些时候,OpenAI宣布在日本东京设立该公司在亚洲的首个办事处,将业务扩展到亚洲,并将发布针对日语优化的GPT-4定制模型。
国家天文台人工智能工作组发布大模型“星语3.0”,已接入望远镜阵列
中国科学院国家天文台人工智能工作组发布新一代天文大模型——“星语3.0”。“星语3.0”基于阿里云通义千问开源模型打造,目前已成功接入国家天文台兴隆观测站望远镜阵列–Mini“司天”。
OpenAI 在日本东京开设首个亚洲办事处并发布日语版的 GPT-4 定制模型
OpenAI 官方宣布在日本东京设立其第一个亚洲办事处,并且将发布针对日语优化的 GPT-4 自定义模型。该定制模型在翻译和总结日语文本方面提供了改进的性能,并且运行速度比其前身快达 3 倍,性价比更加划算。
通用智能CPU初创公司此芯科技完成数亿元A+轮融资,国调基金领投
近日,通用智能CPU公司此芯科技宣布完成数亿元A+轮融资。本轮融资由国调基金领投,昆山国投、吉六零资本、新尚资本跟投。本轮融资将主要用于持续的产研投入及业务落地,尤其是AI PC领域的创新技术研发。此芯科技成立于2021年,致力于为社会提供低功耗智能算力解决方案,赋能个人计算、车载应用、元宇宙基础设施建设领域。
古尔曼:苹果 iOS 18 的首批 AI 功能将完全运行于设备端
据彭博社记者马克・古尔曼 (Mark Gurman)透露,苹果将于 iOS 18 推出的首批全新 AI 功能将完全运行于设备端,而无需依赖云服务器。古尔曼今日在其 Power On 通讯的问答环节中表示:“随着全球都在翘首期盼苹果在 6 月 10 日发布的重磅 AI 技术,目前看来首批功能将完全在设备上运行。这意味着为这些新功能提供支持的大型语言模型将不会用到云端处理。”古尔曼还指出,苹果未来可能会提供一些基于云端的 AI 功能,这些功能可能由谷歌的 Gemini 或其他供应商提供支持。
英特尔中国特供AI芯片曝光,性能暴降92%
据媒体报道,英特尔在其Gaudi 3 AI芯片白皮书中披露,正准备向中国市场推出“特供版”Gaudi 3。中国特供Gaudi 3包括名为HL-328的OAM兼容夹层卡(Mezzanine Card),和名为HL-388的PCle加速卡两种,其中HL-328将于6月24日推出,HL-388将于9月24日推出。与原版相比,中国特供版Gaudi 3拥有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为3.7TB/s,拥有PCIe 5.0 x16接口和解码标准。但是由于美国对于AI芯片的出口管制,其综合运算性能(TPP)需要低于4800才能出口到中国, 这也意味中国特供版Gaudi 3的16bit性能不能超过150 TFLOPS。而原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,因此中国特供版Gaudi 3最终可能需要将其AI性能降低约92%,才能符合美国的出口管制要求。
2024年4月14日·周日
Anthropic CEO 表示领先的人工智能模型的成本将很快上升到 100 亿美元
在接受纽约时报的记者 Ezra Klein 的播客采访时,Anthropic 的 CEO Amodei 谈到了人工智能发展的近期和遥远的未来。他预计未来几年训练大型语言模型的成本将迅速上升。虽然今天的模型成本约为 1 亿美元,但他预计在不久的将来成本将在 10 亿美元左右。“今天的模型训练成本为 1 亿美元,有时会浮动至2~3亿美元。现在正在训练的模型以及将在今年晚些时候或明年初不同时间推出的模型的成本接近 10 亿美元。我认为在 2025 年和 2026 年,我们将需要更多的资金,达到 50 或 100 亿美元。”
AI 程序员智能体 Devin 被质疑造假,演示视频中存在诸多问题
不久之前震撼硅谷的 Devin ,再度震撼硅谷——但这次是被打假。事情是这样的:从事软件行业已经35年的油管程序员博主Internet of Bugs对Devin的视频进行了逐帧分析,逐一举证说明了Devin并不如演示中那般神奇。甚至有“自己现写bug然后当场修复”的骚操作。其它“罪证”,包括但不限于:号称能解决任何Upwork任务,但演示中解决的问题并不是prompt要解决的那一个,做无用功;看起来在修复bug,实际上修复的bug人类程序员根本就不会犯;没有意识到简单两步就能解决问题,花里胡哨一顿操作,其实是自己把任务搞复杂了;修改代码的水平一言难尽。此外,该博主花了半个多小时,把Devin演示视频中的upwork任务完成了一遍——而Devin完成任务可能用时6个多小时。
2024年4月13日·周六
马斯克旗下 xAI 发布具备视觉能力的 Grok-1.5 Vision 模型预览
xAI 发布 Grok-1.5 Vision 预览版,除了强大的文本功能之外,Grok 现在可以处理各种视觉信息,包括文档、图表、屏幕截图和照片,据悉该版本很快就会向早期测试者和现有 Grok 用户推出。官方博客显示,Grok-1.5 Vision 在多个基准测试中表现超越了GPT-4V、Claude 3和Gemini Pro。在接下来的几个月中,Grok 预计将在图像、音频和视频等各种模式中对相关功能进行重大改进。
OpenAI CEO 奥特曼据悉向大型企业推介企业版 ChatGPT,其中包括微软客户
OpenAI首席执行官山姆·奥特曼本月在旧金山、纽约和伦敦接待了数百名500强企业的高管,他和OpenAI的其他高管为企业提供了人工智能服务,并在某些情况下与金融支持者微软进行了正面交锋。与会人员称,奥特曼在每座城市都与100多名高管进行了对话。每次活动中,奥特曼和OpenAI首席运营官都会进行产品演示,包括ChatGPT Enterprise以及这些客户应用程序连接到其人工智能服务的展示。
报道称 Adobe 使用了 Midjourney 等竞对的图像训练其 AI 图像生成器 Firefly
据彭博社报道,Adobe 一直在使用来自竞争对手生成器 Midjourney 以及可能其他图像 AI 的图像来训练其 Firefly 图像生成器。这与 Adobe 声称仅使用其拥有权利或公共领域的内容来训练 Firefly 的说法相矛盾。Adobe 声称仅使用其自己的库存数据库中的材料对 Firefly 进行训练,这在技术上是正确的。但它并没有完全透明地隐藏这样一个事实:目前从其库存数据库中选择的训练数据中有 5% 来自法律和道德背景不明确的人工智能图像。
福布斯发布2024年人工智能初创企业50强
近日,福布斯2023年AI 50榜单评选了最有前途的利用AI开展业务的50家未上市公司。该榜单是福布斯与红杉资本 (Sequoia) 和Meritech Capital合作编制这份年度榜单的第五年。2023年上榜的50家公司总共获得了272亿美元的融资。虽然其中有相当一部分资金是在过去一年中筹集的,尤其以微软对OpenAI的100亿美元投资为甚,但许多上榜公司早在目前的“AI淘金热”出现之前就已经在使用人工智能进行开发了。
2024年4月12日·周五
第二届全球AI安全峰会将于5月21日在韩国举行
全球第二届AI安全峰会将于5月21日至22日在韩国举行。六个月前,英国举办了全球首届AI安全峰会。去年11月,英国举办了全球首届AI安全峰会,讨论如何更高地监管这项快速发展的技术。
360 智脑 7B 参数大模型开源,支持 50 万字长文本输入
360 公司日前在 GitHub 上开源了 360 智脑 7B(70 亿参数模型)。360 智脑大模型采用 3.4 万亿 Tokens 的语料库训练,以中文、英文、代码为主,开放 4K、32K、360K 三种不同文本长度。360 表示,360K(约 50 万字)是当前国产开源模型文本长度最长的。
阿里妈妈将上线一键AI生成短视频功能
阿里妈妈宣布将在万相台无界版“超级短视频”上线AI短视频一键生成能力。据悉,该能力上线后,阿里妈妈超级短视频将自动抓取商家选择商品的关联图片、文案、视频素材,生成符合商品调性的短视频内容。
Gartner 预估 2028 年 75% 的企业软件工程师使用 AI 代码助手
市场调查机构 Gartner 近日发布报告,2023 年年初企业软件工程师使用 AI 代码助手的比例不到 10%,不过预估到 2028 年将达到 75%。Gartner 于 2023 年第 3 季度调查了全球 598 家知名企业,结果显示 63% 的企业目前正在试用、部署或已经部署了 AI 代码助手。
瑞莱智慧完成新一轮战略融资,北京市人工智能产业投资基金等投资
近日,人工智能安全基础设施提供商瑞莱智慧(RealAI)完成新一轮战略融资,北京市人工智能产业投资基金等参与投资。据了解,本轮融资完成后,瑞莱智慧将继续加速通用人工智能安全基座产品研发,并不断推进安全可控的大模型商业化落地。
李彦宏首谈文心大模型为什么不开源:闭源才有商业模式,能力更强
百度创始人、董事长兼首席执行官李彦宏在内部讲话时谈及文心大模型为何不开源时表示:“一年前文心刚刚发布的时候,我们内部是有过非常激烈的讨论的,最后当然大家也知道这个结果,我们的决定是不开源。为什么不开源?当时的判断是,市场上一定会有开源的模型,而且是不止一家会开源。在这种情况下,多百度一家开源不多,少百度一家开源也不少。”李彦宏认为,目前国外像 Llama、Mistral 都有相当的影响力,国内的智源、百川、阿里的通义也都是开源模型,市场上不缺百度这一家开源的模型。百度要开源还得自己去维护一套开源的版本,这不划算。
OpenAI:新 GPT-4 Turbo 模型现可供付费 ChatGPT 用户使用
4月12日,OpenAI在社交平台X宣布,新GPT-4 Turbo模型现已可供付费ChatGPT用户使用。OpenAI表示,其提升了该模型写作、数学、逻辑推理和编码的能力。据OpenAI介绍,GPT-4 Turbo现已在ChatGPT Plus、Team、Enterprise和API中可供使用。
消息称马斯克的 xAI 寻求融资至多 40 亿美元
马斯克的人工智能初创公司xAI正在寻求融资30亿至40亿美元,根据发给投资者的材料,这将使该公司的估值达到180亿美元。据一位知情人士透露,硅谷风险投资界正在流传有关这次潜在融资的电子邮件,其中包括一份大约20页的推介文稿。这位不愿透露姓名的人士表示,与马斯克关系密切的人士已经在他们自己的网络中进行了对话,以评估参与该交易的兴趣。这位知情人士说,这轮融资的条款和金额仍未确定,可能会发生变化。上周末有报道称该公司正在寻求融资30亿美元。
清华大学在芯片研究领域获重要突破
记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度光计算架构,研制大规模干涉-衍射异构集成芯片太极(Taichi),实现160 TOPS/W的通用智能计算。
Sam Altman 重返董事会后首次人事调整:因泄密开除两名 OpenAI 研究员
据知情人士透露,OpenAI已经解雇了两名研究人员,理由是他们涉嫌泄露公司秘密。这两人分别是利奥波德·阿森布伦纳和帕维尔·伊兹梅洛夫。其中,阿森布伦纳是致力于保障人工智能社会安全团队的研究人员,也是OpenAI首席科学家伊利亚·苏茨凯弗的盟友。去年秋天,苏茨凯弗曾参与了罢免OpenAI首席执行官萨姆·奥特曼的行动,但以失败告终。而伊兹梅洛夫则是一名专注于推理研究的专家,他也曾在安全团队中工作过一段时间。目前尚不清楚这两名被解雇的员工泄露了哪些信息。但值得注意的是,此次解雇事件是自奥特曼今年3月重返董事会以来,OpenAI首次被公开披露出现人事变动。
“木头姐”凯茜·伍德宣布已投资OpenAI,未披露股权获取途径
“木头姐”凯茜·伍德管理的方舟投资管理公司当地时间周四宣布,已通过投资获得人工智能初创公司OpenAI的部分股份,但未披露通过何种途径对OpenAI进行了投资。方舟投资致信客户称:“截至2024年4月10日,方舟风险基金已投资了OpenAI。这家公司处于人工智能技术寒武纪大爆发的前沿。”
消息称苹果最快年底推出 M4 系列芯片:更擅长处理 AI 任务,支持最高 512GB 统一内存
彭博社的马克・古尔曼在最新一期 Power On 时事通讯中,认为苹果正加速研发 M4 系列 Apple Silicon 芯片,有望提前到 2024 年年底装备在新款 Mac 设备中,且重点提高处理 AI 任务的性能。苹果公司于去年 10 月发布了 M3、M3 Pro 和 M3 Max 芯片,古尔曼认为苹果同样会在今年 10 月前后推出 M4 系列芯片。M4 处理器预计至少有三个主要型号。低端芯片代号为 Donan,中端芯片代号为 Brava,高端芯片代号为 Hidra。
OPPO 和 OnePlus 智能手机将于今年晚些时候集成谷歌 Gemini 人工智能
Google Gemini 大语言模型(LLM)的 Ultra 1.0 版本将于今年晚些时候登陆 OnePlus(一加) 和 Oppo 手机。这两家公司是在Google”Cloud Next 2024″大会上宣布这一消息的。Gemini LLM分为几个层级,最小的是Nano,可以在设备上运行,很快就会登陆Pixel 8,而Ultra是其能力最强的云端版本,为Gemini Advanced聊天机器人提供算力。Ultra 能理解高度复杂的任务和上下文,从而提供有用的回复。
Humane 宣布其可穿戴 AI 硬件产品 AI Pin 现已在美国全面上市
AI 硬件初创公司 Humane 宣布全面推出其全球首款可穿戴人工智能AI计算机 Humane AI Pin。该AI产品是一款可穿戴计算机,旨在充当助手和第二大脑,内置人工智能来帮助用户寻求答案、做笔记、捕捉瞬间、拨打电话和发送消息。该产品硬件方面售价 699 美元,软件服务订阅采用包月套餐(每月 24 美元),为所有客户提供无限的人工智能查询、无限的通话、文本和数据以及无限的照片和视频存储。
亚马逊发力人工智能,任命Andrew Ng(吴恩达)为董事会成员
为进一步发展人工智能业务,亚马逊任命Andrew Ng(吴恩达)为董事会成员。吴恩达是AI Fund的管理合伙人,这是一家帮助企业家建立人工智能公司的风险工作室。吴恩达还是DeepLearning的创始人、Coursera董事长兼联合创始人,也是斯坦福大学的兼职教授。吴恩达还曾在百度工作,并于2011年至2012年担任Alphabet旗下谷歌大脑(深度学习)项目的创始负责人。
美众议员提出新法案:AI 公司应当披露受版权保护训练数据使用情况
据 Billboard 报道,美国众议员 Adam Schiff 当地时间周二提出了一项新的法案。若该法案通过,AI 公司将被要求披露受版权保护训练数据的使用情况,否则将面临经济上的处罚。该法案名为《生成式 AI 版权披露法案》,它既适用于新的生成式 AI 模型,也可追溯至之前发布、投用的 AI 系统。该法案要求在 AI 模型在向消费者提供之前 30 天内,需要向版权局提交该模型训练数据集中受版权保护作品的完整清单。当现有模型的训练数据集“发生重大改变”时,也必须及时向版权局提交。
2024年4月11日·周四
国家网信办发布第五批深度合成服务算法备案信息,理想汽车 MindGPT 等 394 个算法在列
国家网信办今日发布公告,根据《互联网信息服务深度合成管理规定》,现公开发布第五批境内深度合成服务算法备案信息。本次共有 394 个算法通过备案,其中包括理想汽车“理想同学”MindGPT 大模型算法、知乎“知海图”AI 深度合成算法、优酷生成合成类算法、饿了么用户对话导购算法、阅文妙笔文本生成大模型算法、阅文妙笔图像生成算法、WPSAI 文生图算法、月之暗面 Moonshot-1 语言模型算法、淘宝生成式电商导购算法、粉笔主观题智能批改生成合成类算法、百度人脸融合算法等。备案信息可查看我站的 AI备案查询页面 ,整理了截至目前所有940个算法备案。
华为全新 MateBook X Pro 发布,首搭华为盘古大模型
在今日下午的华为鸿蒙生态春季沟通会上,余承东发布了全新 MateBook X Pro 笔记本,主打轻薄设计,可选三款配色,定价 11199 元起。该机搭载Ultra 9高性能处理器,是全球首款14.2英寸柔性OLED笔记本,并首次支持华为盘古大模型,可实现AI概要功能,并集成WPS AI、文心一言、讯飞星火、智谱清言等合作伙伴应用。
面壁智能完成新一轮数亿元融资,春华创投、华为哈勃领投
近日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。本轮融资将用于人才引入,大模型底层算力与数据基础构建,和大模型落地三个方向。光源资本担任独家财务顾问。面壁智能创立于2022年8月。面壁智能团队核心成员来自清华大学自然语言处理与社会人文计算实验室 (THUNLP),2020年12月,团队发布国内首个中文大模型CPM-1。
支付宝AI金融助理“支小宝”2.0开启对外测试,累计已有1200万用户体验
蚂蚁集团的“AI金融助理”支小宝2.0版本已经处于对外测试阶段。支小宝定位于理财和保险专业知识问答,同时提供行情及持仓分析、智能核保和理赔等专业工具。目前,在支付宝APP的蚂蚁财富和蚂蚁保频道内,均能唤起支小宝服务,支持文字和语音问答。据了解,新版支小宝已有1200万用户体验,一季度“行情”等成为用户最热门的提问词。
估值 860 亿美元,OpenAI 通知前员工也可出售股份
据媒体报道,知情人士透露,OpenAI已经通知部分前员工,允许他们出售公司股份。此举是对公司最近860亿美元估值收购要约的进一步动作,这使得OpenAI跻身全球最具价值的初创公司之列。这笔交易将由Josh Kushner领导的风险投资公司Thrive Capital主导。原定于去年进行的股票出售,因去年11月OpenAI董事会罢免首席执行官Sam Altman而推迟。随后,公司重新聘请了Altman,并正在调整董事会成员。除了收购要约,OpenAI还在探讨新一轮融资,有望将公司估值推高至1000亿美元以上。与此同时,Altman正积极筹集资金,以增加全球尖端计算芯片的供应。
蚂蚁集团 CodeFuse 内测“图生代码”功能,支持产品设计图一键生成代码
蚂蚁集团自研的智能研发平台 CodeFuse 推出“图生代码”新功能,支持开发人员用产品设计图一键生成代码,大幅提升前端页面的开发效率。目前相关功能正在内测。图生代码,可以根据设计图一键生成代码,可以极大降低开发团队在开发网页、小程序、APP时的代码工作量。
英伟达 H100 AI GPU 短缺缓解,交货时间从 3-4 个月降至 2-3 个月
据 Digitimes 报道,台积电的台湾地区总经理 Terence Liao 表示,过去几个月英伟达 H100 的交货等待时间已经大幅缩短,从最初的 3-4 个月降至目前的 2-3 个月(8-12 周)。服务器代工厂商也透露,相比 2023 年几乎无法买到英伟达 H100 的情况,目前供应瓶颈正在逐步缓解。
奥特曼会见阿联酋投资者和官员,宣传全球人工智能联盟为AI提供基础设施支持
据彭博社报道,多位知情人士透露,OpenAI 首席执行官 Sam Altman 一直致力于在政府和行业领导者之间建立一个全球联盟,以支持增加开发人工智能技术所需的芯片、能源和数据中心容量的供应。不愿透露姓名的知情人士表示,奥特曼本周在阿拉伯联合酋长国会见了投资者和政府官员,讨论私营部门如何与各国合作,支持昂贵的大规模人工智能基础设施。
Adobe加快构建文生视频AI模型,以3美元/分钟购买视频资源
在OpenAI的文生视频模型Sora引发市场狂热关注后,Adobe公司也坐不住了。目前,该公司已经加快脚步,开始采购视频,以构建其AI文生视频模型。根据一份文件显示,该软件公司目前向其摄影师和艺术家网络每人支付120美元,要求他们提交人们日常活动的一些视频,比如走路或表达喜悦和愤怒等情绪。该公司写道,目标是为人工智能训练提供资源。
微软 5 月份 Build 大会将介绍“下一代” Windows on Arm 和新的 AI 功能
微软的年度开发者大会 Microsoft Build 今年将重点关注 Windows on Arm 和新的 Windows AI 功能。The Verge在本周早些时候透露,在微软 Build 大会前一天举行的Surface 和 AI特别活动上,将重点展示搭载新 Arm 处理器的 Surface 设备和全新的 Windows AI 功能,特别是介绍可以击败苹果搭载 M3 处理器的 MacBook Air的性能。现在,微软几乎确认了这一点,最新的 Build 开发者会议日程显示,其中有两场会议提到了”下一代 Windows on Arm”和”全新的 Windows AI 功能”。
谷歌将于5月面向所有谷歌相册用户免费提供AI照片编辑器
谷歌周三宣布,将向谷歌相册的所有用户免费提供几款由生成式人工智能驱动的照片编辑工具。该公司在一篇博客文章中表示,从5月15日开始,在接下来的几周内,它将扩大对人工智能编辑功能的访问,这些功能以前只适用于Pixel手机和谷歌One云存储订阅服务。
Meta 发布新一代 AI 训练与推理芯片,性能为初代芯片三倍
Meta Platforms 于当地时间 10 日发布了其训练与推理加速器项目(MTIA)的最新版本,MTIA 是 Meta 专门为 AI 工作负载设计的定制芯片系列。目前,MTIA 主要训练排名和推荐算法,但 Meta 表示,其目标是最终扩展芯片功能,开始训练生成式人工智能,如其 Llama 语言模型。此次发布的新一代 MTIA 芯片据悉将“从根本上”侧重于提供计算、内存带宽和内存容量之间的适当平衡。该芯片拥有 256MB 的片上内存和 1.35GHz 的主频,采用台积电 5nm 工艺制造,相较于第一代产品的 128MB 和 800MHz 实现了显著提升。
图灵奖得主、Meta AI 负责人 Yann LeCun:大模型永远无法达到人类智力水平
周二在参与 Meta 伦敦的一次活动上,图灵奖得主、Meta AI 负责人 Yann LeCun 再次表达了对AGI的怀疑态度。他认为“通用人工智能”这一概念并不存在,因为人类智能并不具有普遍性。他更倾向于追求“人类水平的AI”。LeCun 指出,目前的AI系统无法解决四个基本的认知挑战:推理、规划、持久记忆和理解物理世界。没有这些能力,AI应用将受限且容易出错,例如自动驾驶汽车在公共道路上的安全性问题、家用机器人在处理基本家务方面的困难,以及智能助手只能完成基本任务。LeCun特别强调了大模型LLMs的局限性,它们主要依赖于文本形式的人类知识。尽管LLMs在语言流畅性方面表现出色,但它们对现实世界的理解非常浅薄。LeCun还提到,人类通过与世界的互动获取信息,而不是仅仅通过阅读文本。他估计一个四岁的孩子所接触到的数据量是世界最大LLMs的50倍。
消息称苹果或在 iOS 18 中为 Safari 添加 AI 浏览助手
X 用户 Nicolás Álvarez 发现苹果服务器的后端代码揭示了 iOS 18 将启用Safari浏览助手的新功能。对此,外媒 MacRumors的作者 Aaron Perris 已确认上述代码的存在,但尚无法确定其具体细节。Álvarez猜测,浏览助手可能会利用iCloudPrivate Relay的基础设施,以隐私为中心地传送相关数据至苹果。这可能需要订阅iCloud+服务,但这仅是推测。此外,Álvarez还在苹果服务器代码中发现了所谓的“加密视觉搜索”功能,但其具体细节并不清楚。
2024年4月10日·周三
Mistral AI 推出 Mixtral 8x22B MoE 模型
法国人工智能初创公司Mistral AI通过发布一条磁力链,向AI社区公开了一个281GB的文件,其中包含了他们的全新Mixtral 8x22B MoE(Mixture of Experts)模型,具有56层网络,48个注意力头,8名专家和2名活跃专家,能够处理高达65k的上下文长度。该模型已在Hugging Face平台上上线,社区成员可以基于此构建自己应用。
Arm CEO示警:美国AI数据中心耗电量占比将达到20%~25%
Arm公司CEO雷内·哈斯近日警告称,如果人工智能继续变得更加强大,而不提高能效,未来AI数据中心可能会消耗大量电力。哈斯预计,虽然目前美国AI数据中心耗电量占电网比重仅为4%,但是预计到2030年,占比将达到20%~25%。他特别强调,ChatGPT这样的流行大语言模型耗电尤其严重。
百度网盘推出 AI 摄影创意和写真创作工具超能画布
百度网盘宣布推出AI摄影创意工具 超能画布 ,通过百度自研图像大模型以及智能人脸融合算法,上传1张照片,输入一句文字指令,1分钟即可生成AI写真,批量切换背景、服装,还能对人物表情、发色、画面元素进行局部重绘。在样片模板研发上,相比传统影楼3个月的研发周期,超能画布可分钟级生成样片,提效90倍。
QQ音乐新版本上线“AI助手”,陪伴式听歌提升用户情绪价值
QQ音乐13.3新版本灰度上线“AI助手”功能,该功能首开音乐流媒体领域AI辅助先河,运用大语言模型技术提升QQ音乐内用户找歌效率,并实现让用户通过简单对话即可体验听歌互动和聊天陪伴。据悉,此次推出的“AI助手”可满足用户多维度找歌需求,并具备音乐知识问答、播放控制操作、功能跳转和聊天陪伴等功能。
百川智能发布一周年信:过去一年,保持业内最快的模型更新速度
由原搜狗CEO王小川创立的百川智能今日发布1周年信,表示,过去一年,百川智能保持了业内最快的模型更新速度,以月度为单位相继推出了11款大模型,涵盖了开源、闭源、学术科研、国产算力等多个维度。百川智能称,过去一年在开源和闭源领域均交上了一份不错的答卷。百川智能表示,未来将不断探索和突破技术的边界,并且为技术找到合适的场景,通过基础大模型的技术赋能与超级应用,从创造、健康、快乐三个维度为用户和合作伙伴创造更多价值,为 AI 技术发展贡献更多力量。
AI芯片研发公司「墨芯」完成两轮数亿元融资,蚂蚁集团等投资
墨芯人工智能(以下简称「墨芯」)近半年内相继完成A+轮、B轮各数亿元人民币的两轮融资。其中,B轮融资由蚂蚁集团领投,盛景嘉成跟投;A+轮融资由金浦投资上海金融科技基金领投,华大松禾天使基金、岩山科技战略跟投,多家财务机构、老股东将门创投继续跟投。告捷资本持续担任公司两轮融资的财务顾问。两轮募集的资金将用于「墨芯」公司二代AI芯片的研发、市场拓展及稀疏化生态的构建。
英特尔:预计将于2024年出货4000万台AI PC
在Intel Vision 2024大会上,英特尔CEO帕特·基辛格透露,英特尔预计将于2024年出货4000万台AI PC,以及超过230种的设计,覆盖轻薄PC和游戏掌机设备。据帕特·基辛格介绍,将于2024年推出的下一代英特尔酷睿Ultra客户端处理器家族(代号Lunar Lake),将具备超过100 TOPS平台算力,以及在神经网络处理单元(NPU)上带来超过46 TOPS的算力,从而为下一代AI PC提供强大支持。
OpenAI 通过 API 向开发人员提供具有视觉能力的 GPT-4 Turbo with Vision
OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。
马云内部发声:AI时代刚刚到来,我们正当其时
今天,马云在阿里内网发表题为《致改革 致创新》的帖子,高度肯定蔡崇信和吴泳铭组成的新管理层的变革勇气,称阿里巴巴已重回健康成长轨道,并支持继续改革。据悉,这是退休后的马云五年来首次长篇幅分享对公司改革创新及未来前景的思考。针对行业未来,马云判断“三、五年的时间跨度对于互联网领域而言,犹如一个世纪之久,足以发生翻天覆地的变化,AI时代刚刚到来,一切才刚开始,我们正当其时!”
苹果介绍 Ferret-UI 多模态大语言模型:更充分理解手机屏幕内容
苹果公司近日发布研究论文,展示了 Ferret-UI AI 系统,可以理解应用程序屏幕上的内容。现阶段的多模态大模型(MLLMs)还无法有效理解移动应用程序,这主要有以下几个原因:1. 手机屏幕的宽高比,和大多数训练图像使用的屏幕宽高比不同。2. MLLMs 需要识别出图标和按钮,但它们相对来说都比较小。因此苹果构想了名为 Ferret-UI 的 MLLM 系统解决了这些问题。
英特尔发布 AI 芯片 Gaudi 3,称性能超越英伟达 H100
在昨晚的 Vision 2024 活动中,英特尔发布了新一代 Gaudi 3 AI 芯片,并将于 2024 年第三季度通过 OEM 系统大批量上市。据介绍,新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%,推理能力提高了 50%,效率提高了 40%,但成本却低得多。
Meta 确认其 Llama 3 开源大语言模型将于下个月推出
在本周二于伦敦举行的一次活动上,Meta 公司确认其计划在下个月内首次发布 Llama 3(用于支持生成式人工智能助手的下一代大型语言模型)。这证实了此前 The Information 周一发表的报道。Meta 公司全球事务总裁尼克-克莱格(Nick Clegg)说:“我们希望在下个月内,甚至更短的时间内,开始推出我们新的下一代基础模型套件 Llama 3。”他的描述听起来像是要发布该产品的几个不同迭代或版本。“今年内,我们将发布一系列具有不同功能、不同通用性的模型,很快就会开始发布。”
谷歌推出适用于 Workspace 的 AI 视频创作工具 Google Vids
在 Cloud Next 2024 上,谷歌宣布推出一款新的 Workspace 应用程序 Google Vids ,可以作为视频脚本编写和视频制作编辑助手。用户可以通过简单的提示和素材整合,生成故事板并编辑视频。Google Vids目前在小范围内测中,尚未对所有用户开放,将在2024年6月通过 Workspace Labs 推出。
2024年4月9日·周二
谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频
谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini 1.5 Pro。谷歌现已推出 Gemini 1.5 Pro 公共预览版,并借此为其赋予了“耳朵”,从而帮助用户处理音频内容,例如可以直接上传一份音频文件让它来分析,或者上传一份财报电话会议录音或视频来让它总结。
微软据悉将向日本数据中心投资29亿美元,以提供更多的AI算力
微软公司总裁布拉德·史密斯(Brad Smith)表示,微软将在2025年前向日本的数据中心投资29亿美元,以响应东京为人工智能提供更多计算能力的呼声。目前正值日本首相岸田文雄访问华盛顿之际,微软预计将在未来几个小时内宣布其投资计划。
WPS AI 企业版发布:多个大模型自由切换调用
金山办公正式推出了面向组织和企业的WPS 365,包含升级的WPS Office、最新发布的WPS AI企业版和WPS协作。WPS AI企业版是该方案的核心组件之一,它由AI Hub(智能基座)、AI Docs(智能文档库)和Copilot Pro(企业智慧助理)三部分构成,全面展现了金山办公在人工智能领域的技术积累和创新实力。AI Hub集成了国内主流大模型的AI能力,如MiniMax、智谱AI、文心一言、商汤等。
北大开源 aiXcoder-7B 代码大模型,专为企业私有部署设计
北大的 aiXcoder 团队最新开源代码大模型——aiXcoder-7B Base版,一个专门适合在企业软件开发场景中部署的代码大模型。该模型在1.2T Unique Tokens上做了大量的训练,并且该模型的预训练任务及上下文信息都为真实代码生成场景做了独特的设计。aiXcoder 7B Base 在HumanEval、MBPP和MultiPL-E三大主流评测集上的平均得分超过340亿参数的Codellama。在代码补全场景下是所有同等级参数量模型中效果最好的,主流多语言NL2Code基准测试中,平均上效果也超过Codellama 34B 和StarCoder2 15B。
联发科推出生成式AI平台“达哥”和大模型 MR BreeXe,繁体中文能力超越 GPT-3.5
据联发科官方消息,在今日举行的生成式 AI 论坛期间,联发科生成式 AI 服务平台 MediaTek DaVinci 正式推出,亦称“联发科技达哥”,目前已有超过 40 家厂商加入其生态系统。同时,联发创新基地还发布了该平台最新的繁体中文大型语言模型 MediaTek Research BreeXe,该模型以 Mixtral 8x7B 模型为基础开发,继承 Mixtral 多专家模型特有的节省运算资源、提升速度优势,号称在繁体中文测试项目(TMMLU+、MT Bench TW)超越 GPT-3.5。
胡润《2024全球独角兽榜》发布:字节跳动蝉联第一,OpenAI空降第三
4月9日,胡润研究院发布《2024全球独角兽榜》,列出了全球成立于2000年之后,价值10亿美元以上的非上市公司。其中,字节跳动以1.56万亿元的估值连续第三年成为全球价值最高的独角兽。SpaceX价值增长近3100亿元,达到了1.28万亿元,排名第二。OpenAI价值增长最快,增长近5700亿元人民币,以7100亿元成为全球第三大独角兽。榜单显示,前十名独角兽增长价值1.4万亿元,占全榜单增长价值的近一半。在中国,成立一年的月之暗面(Moonshot AI)和成立两年多的名之梦(MiniMax)在类似ChatGPT的产品方面处于领先地位。
韩国计划到 2027 年在 AI 和相关半导体领域投资 9.4 万亿韩元
韩国总统尹锡悦4月9日表示,韩国将彻底重新审视吸引芯片投资的激励措施,并准备为该行业提供“大胆支持”。尹锡悦称,到2027年韩国将在人工智能和AI半导体领域投资9.4万亿韩元(注:约501.96亿人民币),并创建一支规模1.4万亿韩元的基金,以帮助创新AI半导体公司的增长。
报道称 DeepMind 联合创始人对 Google AI 与 DeepMind 的合并以及商业化策略“深表失望”
据美媒 The Information 报道,谷歌人工智能部门的主管及 DeepMind 联合创始人德米斯·哈萨比斯(Demis Hassabis)对公司在推动人工智能商业化上的新策略深表失望,并曾在两个AI部门(Google AI 和 DeepMind)合并成立新实验室时考虑过离职。他向同事透露,谷歌在追赶 OpenAI 的 Sora 项目方面可能面临着重重挑战。
微软看好高通骁龙 X Elite 芯片,称 AI PC 超越苹果 M3 MacBook Air
微软正筹备下月在西雅图举办的专场活动,计划全面展示对 AI PC 的愿景。根据国外科技媒体 The Verge 报道,知情人士透露微软对搭载 Arm 处理器的 Windows 笔记本电脑充足信心,认为无论在 CPU 性能还是处理各项 AI 任务方面,都能超越苹果公司搭载 M3 芯片的 MacBook Air。
消息称 Meta 计划下周推出两个小型的 Llama 3 版本
当地时间周一,科技媒体The Information援引一位Meta员工消息报道称,该公司计划在下周推出两个小型的Llama 3大语言模型(LLM),作为夏季推出正式版Llama 3的先行版本。这两个小模型的发布,预计将为Llama 3的正式亮相进行铺垫。Llama 3直接对标OpenAI的GPT-4,后者已经成为一个强大的多模态模型,不仅能够处理更长的文本,还支持图像输入。报道称,正式版Llama 3也将支持多模态处理,即同时理解和生成文本及图片;而先行推出的两个小版本则不具备这一能力。
谷歌宣布 Android Studio 整合 Gemini 1.0 Pro:可生成、补全代码
谷歌近日发布新闻稿,宣布在 Android Studio 中集成 Gemini 1.0 Pro,从而帮助开发人员更快、更好地写出代码。谷歌表示目前相关整合仍处于预览阶段,邀请开发者免费体验 Gemini 的各项技能,其中包括帮助生成应用程序代码、提供复杂的代码补全、回答您的问题、查找相关资源、添加代码注释等。谷歌表示 Gemini 1.0 Pro 充分考虑到了隐私问题,明确只有开发者登录账号,并手动选择启用之后,才会生效。
百度智能云发布千帆大模型一体机,加速企业私有化部署大模型
百度智能云GENERATE全球生态大会在成都召开。会上,百度智能云发布千帆大模型一体机,为企业私有化部署大模型提供最佳解决方案。百度副总裁谢广军表示,千帆大模型一体机是软硬一体化的企业专属大模型解决方案,提供了开箱即用的大模型工具链。在核心功能方面,千帆大模型一体机预置了百度自研的文心大模型,以及Llama、Baichuan、ChatGLM等十余个主流开源大模型,并结合不同算力资源进行了深度定制,能够在更低能耗的条件下拥有更高的性能表现。
马斯克透露特斯拉囤积的英伟达 H100 芯片数量仅次于 Meta X
平台用户“The Technology Brother”最近发布消息称,Meta 公司已经囤积了全球最多的 H100 GPU,数量达到惊人的 35 万块。然而,马斯克对该排行榜将特斯拉和 xAI 的排名边缘化表示不满(1 万颗),并指出“如果计算正确,特斯拉应该是第二名,xAI 将是第三名”。这番表态意味着特斯拉目前可能拥有 3 万到 35 万颗的 H100 GPU,而 xAI 则拥有大约 2.6 万到 3 万颗。
马斯克:AI有望在明年超越最聪明的人类,Grok 2.0 将超越 GPT-4
马斯克预测,到明年或2026年,AI可能会比最聪明的人类更聪明;据悉,xAI正在训练2.0版本的Grok,这一版有望比Open AI的GPT-4更强大,预计将在5月前完成相关训练;马斯克称,芯片短缺是目前AI发展的一大制约因素,但在未来一两年,电力供应将至关重要。
2024年4月8日·周一
摩根大通CEO:AI对人类的影响堪比蒸汽机、电力和计算机
美东时间周一,摩根大通首席执行官杰米·戴蒙在年度股东信中表示,人工智能(AI)将对商业、经济或社会产生全面影响,堪比过去的几次工业革命。戴蒙是世界上最具影响力的商业领袖之一,他在信中写道:”我们完全相信,人工智能的影响将是非同寻常的,可能像过去几百年中一些重大技术发明一样具有变革性,想想印刷机、蒸汽机、电力、计算机和互联网等。”
消息称三星与韩国互联网巨头 NAVER 启动 Mach-2 人工智能芯片联合研发
据韩媒 ETNews 报道,三星电子与韩国互联网巨头 NAVER 双方已启动人工智能芯片 Mach-2 的联合研发。消息人士透露,双方正在讨论 Mach-2 芯片开发设计的重点。该芯片将由 NAVER 设计核心软件,三星电子则负责芯片的设计和生产。三星电子与 NAVER 于 2022 年达成研发合作协议,为超大规模人工智能模型(如 NAVER 的 HyperCLOVA X 模型)开发定制半导体解决方案,最近引发关注的 Mach-1 推理加速芯片就是双方合作的成果。
微软在伦敦设立新的人工智能中心
微软当地时间4月7日宣布,微软新的人工智能部门(Microsoft AI)将在伦敦市中心开设一个新的人工智能中心,该中心由人工智能科学家和工程师乔丹·霍夫曼(Jordan Hoffmann)领导,霍夫曼此前曾在Inflection公司和DeepMind公司供职。
加拿大政府公布人工智能领域一揽子预算,价值 24 亿加元
加拿大政府昨日公布了面向人工智能领域的一揽子措施,以确保该国在此领域的优势。这些措施将在加拿大政府本财年的预算中占到 24 亿加元(当前约 127.92 亿元人民币)。其中的绝大部分 20 亿加元将用于为加拿大人工智能研究者和企业提供算力和基础设施,并促进主权人工智能发展
马斯克称今年特斯拉自动驾驶累计投入将超百亿美元
马斯克近日在X上表示,特斯拉今年在自动驾驶领域的累计投入将超过 100亿美元。这番言论源于一位电动汽车支持者对于特斯拉FSD 训练过程的猜测,马斯克在回复网友时指出,特斯拉今年在训练计算、数据管道和视频存储方面的累计投入将超过100亿美元。他写道: “实现通用自动驾驶的难度令人震惊,它需要我们上面所描述的一切,甚至更多。仅今年,特斯拉在训练计算、庞大数据管道和海量视频存储方面的累计投入就将超过 100 亿美元。但这与道路上安装了特斯拉设计的 AI 推理计算机并由司机训练的价值约2500亿美元的汽车相比根本不算什么。”
二次元 AI 角色创作平台「捏Ta」完成超千万元融资
近日AI角色创作平台“ 捏Ta ”(公司名为“看见概念”)完成了天使轮和Pre-A轮融资,总额超千万元。投资方包括源码资本和奇绩创坛等,所得资金将主要用于模型的进一步优化、多模态功能的增强以及社交玩法的开发。成立于2022年12月,捏Ta可被看做为以角色幻想故事智能创作为主的早期“小红书”。看见概念CEO胡修涵将捏Ta用户的创作过程比作“根据设置好的剧情,为角色拍摄照片”。
2024年4月7日·周日
通义千问开源320亿参数模型 Qwen1.5-32B,已实现7款大语言模型全开源
阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本。
百度文心一言APP上线新功能,可快速定制自己的 AI 声音
近日百度文心一言上线了新功能,仅需几秒钟即可定制自己的声音。想要体验这一功能,用户只需打开 文心一言App ,点击下方“+”,然后选择创建智能体。在声音选项里,会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话,只需两秒左右的时间,系统便能捕捉到你的声音特点,为你生成一个独特的“语音助手”。
斯坦福团队推出可在手机等端侧设备运行的 20 亿参数大模型 Octopus v2
近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社区的极大关注,模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行,在准确性和延迟方面超越了 GPT-4,并将上下文长度减少了 95%。此外,Octopus v2 比 Llama7B + RAG 方案快 36 倍。
消息称三星获英伟达 AI 芯片 2.5D 封装订单
据业内人士透露,三星电子最近获得了一批英伟达AI芯片的2.5D封装订单,并正在批量生产。韩媒预计,日前中国台湾地区地震或将进一步影响台积电CoWoS产能,三星对英伟达2.5D封装订单或有望进一步增加。
消息称马斯克的人工智能公司 xAI 寻求 30 亿美元融资,估值达180 亿美元
据熟悉内情的消息人士对媒体表示,与马斯克关系密切的投资者正在洽谈帮助xAI在一轮融资中筹集多达30亿美元,这将使这家马斯克旗下人工智能初创公司的估值达到180亿美元。上述人士称,风险投资公司Gigafund和马斯克的著名支持者、另一家风险投资公司的联合创始人Steve Jurvetson,均是考虑参与xAI此轮融资的投资方。
金山办公 WPS 365 宣布 4 月 9 日全新发布:“一站式 AI 办公”
金山办公生产力大会官宣 4 月 9 日 15 点举行,宣称“WPS 365 全新发布”。官方海报写有“一站式 AI 办公生产力即刻起飞”,暗示 WPS 365 将迎来更多 AI 功能升级。2023 年 4 月,金山办公面向政企客户发布了数字办公品牌 WPS 365,该服务提供一系列内容创作应用和办公协作工具,涵盖了内容创作、沟通创作、数字资产管理、开放生态四大版块,包含 WPS Office、文档中心、金山协作、金山会议、邮件、日历等通用办公套件。
报道称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到属于 AI 版权法模糊灰色区域的内容。报道称,OpenAI 迫切需要训练数据,并开发了 Whisper 音频转录模型来克服困难,转录了超过 100 万小时的 YouTube 视频来训练其最先进的大型语言模型 GPT-4。
2024年4月6日·周六
欧盟与美国发表联合声明,宣布将加强在AI领域的合作伙伴关系
4月5日周五,欧盟与美国发表联合声明,宣布将加强在AI领域的合作伙伴关系。声明称,合作旨在共同商讨如何让AI既安全又有用。双方决定共同开展一些用AI造福人类的研究项目,包括共同研究如何让AI帮助人类进行极端天气和气候预测、处理紧急情况、提高医疗水平、优化电网和农业生产等。
消息称 Sam Altman 联手 Jony Ive 创办的 AI 硬件初创公司正进行融资谈判,或筹集高达 10 亿美元
据 The Information 报道,由前苹果首席设计师 Jony Ive 与 OpenAI 首席执行官 Sam Altman 共同创办的神秘公司,正计划推出一款 AI 硬件,并且已经开始与几位风险投资界的重量级人物进行融资谈判。据知情人士透露,该初创公司已与 Emerson Collective 和 Thrive Capital 展开讨论,后者是 OpenAI 的一大投资者,其对话式人工智能技术有望成为该设备某些功能的核心。其中一位参与谈判的人士表示,Ive 希望筹集高达 10 亿美元的资金。据讨论中的人士透露,即将开发的这款人工智能设备——预计不会与传统手机外观相似,而且这个合作也将增加 Altman 在 OpenAI 之外的诸多项目。
Meta 将于 5 月起在旗下的社交平台标记“疑似由 AI 生成的内容”
AI 兴起产生的各种隐私 / 版权问题如今已成为科技行业许多人越来越关注的重点,而 Meta 公司今日发布新闻稿,宣布将在 5 月起在自家 Instagram、Threads 及 Facebook 平台为 AI 内容添加“水印标记”。Meta 公司将使用算法及真人检测“可能由 AI 生成的内容“,而用户也可以自行在图片中注释”相关图片由 AI 生成”,此类消息将作为水印添加至用户图片中,以便于他人甄别。
Cohere 推出 Command R+ 企业级大模型,部分基准测试优于 GPT-4 Turbo
Cohere 是一家领先的企业级人工智能解决方案提供商,日前宣布推出 Command R+,这是其最先进、可扩展的大型语言模型,专为实际业务应用程序而设计。新模型建立在其前身Command R的优势之上,同时提供增强的性能、多语言支持和高级检索增强生成(RAG)功能。根据该公司提供的评估结果,Cohere 的 Command R+ 在 ToolTalk 和 Berkeley Function Calling 等关键企业 AI 基准测试中优于 Claude 3、GPT-4 Turbo 和 Mistral Large 等大模型。
2024年4月5日·周五
印尼政府:英伟达与印尼电信企业计划投资2亿美元建AI开发中心
印尼通讯与信息部长布迪·阿里·塞蒂亚迪4月4日表示,英伟达和印尼电信企业Indosat Ooredoo Hutchison计划今年在梭罗建设一座名为“Indonesia AI Nation”的人工智能开发中心,投资总额为2亿美元。
OpenAI 高管:2024年是AI的“应用之年”,ChatGPT企业版用户出现爆发式增长
美东时间周四,OpenAI的首席运营官Brad Lightcap预测,2024年是人工智能(AI)的“应用之年”,已经看到了这种巨大的趋势。在当天接受媒体采访时,Lightcap透露,尽管面临越来越多同行竞争,但ChatGPT企业版需求正在急剧增长。目前已有超过60万人注册使用ChatGPT企业版,而今年1月份的注册用户数量仅大约为15万人。
OpenAI 宣布了多项新的微调 API 功能和扩展的自定义模型程序
OpenAI 公司近日发布新闻稿,宣布改善微调(fine-tuning)API,并进一步扩展定制模型计划。该项“自定义模型”的计划,可以帮助企业客户使用其技术针对特定用例、领域和应用程序开发定制的生成式 AI 模型。
2024年4月4日·周四
消息称苹果寻求新的增长方向,将探索家用机器人
媒体援引知情人士消息称,苹果十年造车梦碎后,苹果正在寻求新的收入来源,并将目光投向了家用机器人领域。苹果的工程师们正探索一种能够在家中跟随用户移动的机器人,旨在为家庭生活提供辅助、娱乐或定制化服务。苹果初步认为,这一新领域不仅可以扩大公司在家庭消费中的影响力,而且具有与苹果过去成功推出的革命性产品如iPhone和iPad相媲美的巨大发展潜力。因此,家用机器人项目有可能成为苹果公司未来发展的关键方向。
OpenAI 官宣用户现在可以通过网页、iOS系统、安卓系统等方式在 ChatGPT 中编辑 DALL·E 图片
4月4日周四凌晨1:00,OpenAI宣布,用户现在可以通过网页、iOS系统、安卓系统等方式在ChatGPT中编辑DALL·E图片。DALL·E编辑器界面的最新更新为用户提供了更加直观的图像编辑体验。通过选择图片的特定区域并在聊天框中描述想要的更改,用户可以轻松编辑图片。此外,用户还可以在对话面板中直接提供编辑提示,无需使用选择工具,进一步简化了编辑过程。
马斯克最新预测:AI或在2030年超越人类智力,未来还可能“终结”人类
据国外媒体报道,特斯拉和SpaceX的首席执行官埃隆·马斯克(Elon Musk)日前在“丰富峰会”上与奇点大学和XPRIZE基金会创始人彼得·戴曼迪斯(Peter Diamandis)进行了线上对话。在谈及人工智能的发展速度时,马斯克预计,按照当前的技术进步速度,到2030年人工智能的智力可能超越人类,这项技术甚至有可能终结人类。然而,他并未对未来持悲观态度,而是强调通过积极引导,人工智能有可能为人类带来更加美好的未来。
消息称谷歌考虑对基于 AI 的搜索引擎收费,将部分功能添至高级订阅服务
据英国《金融时报》援引三位熟悉谷歌的知情人士消息称,谷歌考虑对基于人工智能的搜索收费,这对其商业模式来说是一次重大变化。因为自 2000 年以来,谷歌的搜索产品一直都是依靠广告盈利的。据报道,谷歌正在考虑保持标准搜索(不含 AI 功能)免费,谷歌正在考虑各种选择,包括将某些基于 AI 的搜索功能添加到其高级订阅服务中。但是,付费用户仍将在 Gemini 驱动的搜索结果中看到广告。
马斯克:将提高特斯拉AI工程师的薪酬,以阻止OpenAI挖角
特斯拉首席执行官马斯克表示,由于面临人才争夺战,特斯拉一直在提高人工智能工程师的薪酬。他在自己的社交媒体网站X(前身为推特)上发帖称:“特斯拉正在增加人工智能工程团队的薪酬(视进展里程碑而定)。”他说,ChatGPT的创造者OpenAI一直在“积极招募特斯拉的工程师,提供巨额薪酬,不幸的是,在一些情况下取得了成功。”
Stability AI 推出 Stable Audio 2.0 音乐生成模型,可生成最长三分钟的歌曲
Stability AI 宣布推出 Stable Audio 2.0 音乐生成模型,该模型能够通过单一自然语言提示,以 44.1 kHz 立体声播放长达三分钟的高质量完整曲目,具有连贯的音乐结构。新模型不仅具备文本转音频功能,还包含音频转音频功能。用户现在可以上传音频样本,并通过自然语言提示将这些样本转换成各种声音。此更新还扩展了音效生成和风格转换,为艺术家和音乐家提供了更大的灵活性、控制力和更高级的创作过程。新模型现已可在 Stable Audio 网站上免费提供使用,并且很快将在 Stable Audio API 上提供。
亚马逊 AWS 与 Mistral AI 扩大合作,Mistral Large 模型已可在 Amazon Bedrock 上使用
亚马逊 AWS 宣布与法国人工智能初创公司 Mistral AI 扩大合作,AWS 客户现在可以通过 Amazon Bedrock 访问 Mistral AI 的 Mistral Large 模型。此外,Mistral AI 还将使用 AWS AI 优化的AWS Trainium 和 AWS Inferentia 等硬件在 Amazon Bedrock 上构建和部署其未来的基础模型。
2024年4月3日·周三
饿了么翱象系统上线“AI经营助手”,可生成各类经营关键报表
饿了么零售商家SAAS平台“翱象”宣布面向零售行业商家正式发布“AI经营助手”功能。通过这一经营工具,商家可智能生成各类经营关键报表和关键数据,进一步提升经营能力、把握生意机会。
元象首个MoE大模型开源:4.2B激活参数,效果堪比13B模型
元象发布XVERSE-MoE-A4.2B大模型 ,采用业界最前沿的混合专家模型架构 (Mixture of Experts),激活参数4.2B,效果即可媲美13B模型。该模型全开源,无条件免费商用,让海量中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用,推动低成本部署。
OpenAI 发布首个由 Sora 制作的 MV《Worldweight》
OpenAI发布了首个由Sora制作的MV——《Worldweight》,该MV的音乐是由艺术家August Kamp作曲;而MV的画面内容,正是他借助Sora来完成的。用August Kamp自己的话来说:“我心中的Worldweight,终于有了具象的视觉效果。”
最新研究发现“长上下文”让大模型更不安全
今日凌晨,OpenAI 的最强竞争对手 Anthropic 在一篇最新发布的研究论文中,揭示了一种可以用来规避大型语言模型(LLM)开发者设置的安全防护措施的方法——Many-shot jailbreaking,即“多样本越狱攻击”。简单来说,如果你先问 LLM 几十个危害性较小的问题,就可以说服它告诉你一些危害性较大问题的答案,比如“如何制造炸弹”。也就是说,如果是第一个问题,它可能会拒绝回答或答错,但如果是第一百个问题,它就可能会要开防御措施、然后回答。Anthropic 官方表示,这一攻击方法已被证明对 Anthropic 自己的模型(Claude)和其他人工智能公司发布的模型都有效。
OpenAI 前开发者关系负责人 Logan Kilpatrick 正式官宣加入谷歌
入职整整一个月后,OpenAI 前开发者关系负责人 Logan Kilpatrick 正式官宣加入谷歌。他将负责 AI Studio 产品,并为 Gemini API 提供支持。Logan 表示,未来还有很多工作要做,让谷歌成为开发人员使用 AI 进行开发的最佳场所。Logan 加入谷歌是收到了来自谷歌四位大佬的邀请,包括Pichai、Jeff Dean、产品副总裁 Mat Velloso 和谷歌副总 Josh Woodward。另外,Logan 的推文中还透露了一个信息是,谷歌正在组建一支以 AI 开发者为核心的团队。
亚马逊在北京举办生成式AI沟通会,已收到大量中国公司合作需求
据晚点 LatePost 报道,4 月 2 日,亚马逊云科技(AWS 在中国的名称)在北京举办生成式 AI 沟通会,重点展示了一个月前发布的 Claude 3 系列大模型。报道援引一位亚马逊云科技人士消息,AWS 未在中国境内的服务器上部署 Claude 3。和微软 Azure 一样,中国公司可以通过 AWS 全球提供的 Bedrock 服务,申请调用在其他地区部署的 Claude 3 模型并完成计算。这名科技人士还称,Claude 3 系列模型发布后,他们收到了大量中国公司的合作需求。
美国修订对华芯片管制:光刻机只能买老款,RTX4090受限放宽
美国芯片出口管制条款进行了160多页的大版本更新。据了解,新的出口管制条例4月4日生效,美国商务部对此次修订动作定义为“纠正意外的错误,并明确一些条款”。本次更新大体上可概括为新增和修改两类,包括加入了对EUV掩膜、刻蚀机等制造环节设备的管控,新增了对中国澳门地区及D:5组地区采取“推定拒绝”的政策,以及重新澄清AI芯片许可证及其例外情况的适用范围等。对公众关注的“RTX4090禁售”、“H20出口”以及包括光刻机和上下游设备进口的话题,本次更新的细则都有相应的提及与回应。
微软 Copilot for Microsoft 365 更新,可优先访问 GPT-4 Turbo 并取消对话次数限制
微软今天向 Copilot for Microsoft 365 用户宣布两项重要更新:一、优先访问 GPT-4 Turbo 模型,以处理网络和工作数据。微软还将取消对话数量和长度的限制,同时增加文件上传。二、本月晚些时候,微软将向 Copilot for Microsoft 365 用户提供 Microsoft Designer 中扩展的图像生成功能,包括高峰时段的优先访问。
Billie Eilish、Katy Perry 等 200 多位音乐家签署公开信要求停止使用 AI 侵犯艺术家的权利
200 多位音乐艺术家,包括比莉-艾利什(Billie Eilish)、凯蒂-佩里(Katy Perry)和斯莫基-罗宾逊(Smokey Robinson)等重量级人物,向人工智能开发者、科技公司和数字平台写了一封公开信,要求“停止使用人工智能(AI)侵犯和贬低人类艺术家的权利”。这封信专门针对科技公司对音乐艺术家的担忧,如复制艺术家的声音、无偿使用他们的作品来训练人工智能模型,以及稀释支付给艺术家的版税。
雅虎将收购 Instagram 联合创始人创建的 AI 新闻应用 Artifact
雅虎周二宣布,该公司正在从 Instagram 联合创始人 Kevin Systrom 和 Mike Krieger 手中收购人工智能驱动的新闻应用 Artifact。该交易的财务条款并未披露。收购后 Artifact 将不再作为独立应用程序运行,其人工智能驱动的个性化技术将在未来几个月内集成到整个雅虎,包括雅虎新闻应用程序。几个月前,Artifact 表示,由于市场机会不够大,不足以保证持续投资,该公司将停止运营。
2024年4月2日·周二
美国和英国宣布在人工智能安全科学方面建立新的合作伙伴关系
美国和英国宣布在人工智能安全科学方面建立新的合作伙伴关系。美国商务部长吉娜·雷蒙多和英国技术大臣米歇尔·多尼兰周一在华盛顿签署了一份谅解备忘录,宣布共同开发先进的人工智能模型测试。这是继去年首届全球人工智能安全峰会上宣布的国际声明后,全球达成的又一份国际合作。根据合作,美英两国的人工智能安全研究所将展开交流。
支付宝面向全国医院、医疗机构开放“AI 就医助理”解决方案
支付宝今日发布“AI 就医助理”解决方案,利用 AI 大模型、数字人等技术,助力医疗机构为患者提供覆盖就医前、中、后的“AI 陪伴就诊”服务,并宣布这一解决方案将正式面向全国医院、医疗机构开放。
APUS 联合新旦智能开源国内首个千亿级 MoE 架构大模型
4月2日,APUS与战略合作伙伴新旦智能联合训练、研发的千亿MoE(Mixture of Experts)架构大模型,在GitHub上正式开源。从适配低端算力芯片实现行业普惠,到国内首个开源的千亿参数MoE架构大模型模型提质增效。APUS-xDAN 大模型4.0(MoE)可在4090之类的低端算力芯片上运行,综合性能达到了GPT-4 的90%。
阿里大文娱AI数字人录制真人秀综艺《盒子里的猫》,系国内首次
近日,在优酷热播综艺《盒子里的猫》中,阿里大文娱数字人厘里化身出题官亮相。这是继《异人之下》“二壮”一角后,厘里首次参加综艺节目,也成为国内首个录制真人秀综艺的超写实数字人。据官方介绍,厘里已正式接入语义大模型“通义星尘”,成为国内首个能无限制自由对话的超写实数字人。
阿里云原副总裁陈雪松加盟智谱AI
今年1月,Tech星球曾披露阿里云副总裁陈雪松离职,或投身AI赛道的独家消息,最近,陈雪松有了新的工作进展。Tech星球独家获悉,阿里云原副总裁陈雪松已加入北京智谱华章科技有限公司(以下简称“智谱AI”)担任副总裁一职,或继续负责数字政府方面的相关业务。
国家数据局最新透露:将开展数据标注基地试点,促进人工智能产业发展
首次全国数据工作会议于4月1日到2日在北京召开。会议就围绕数据要素市场化配置改革,统筹数字中国、数字经济、数字社会建设发展等,研究部署今年的重点工作。国家数据局方面最新透露,接下来,将开展数据标注基地试点。会上明确,探索建设国家级数据标注基地,充分发挥地方配套支撑作用,在数据标注产业的生态构建、能力提升和场景应用等方面先行先试,集聚龙头企业,促进区域人工智能产业生态发展。
阿里云全面推行 AI 写代码,未来 20% 代码由通义灵码编写
阿里云正在内部全面推行 AI 编程,使用 通义灵码 辅助程序员写代码、读代码、查 BUG、优化代码等。阿里云还专门给通义灵码分配了一个正式的员工工号 ——AI001。据阿里云相关人士透露:“公司未来 20% 的代码将由通义灵码编写,但程序员仍然是研发的核心,他们将有更多时间专注于系统设计以及核心业务开发工作。”
昆仑万维 AI 音乐生成大模型「天工SkyMusic」今日启动邀测
4月2日,昆仑万维AI音乐生成大模型「天工SkyMusic」即日起面向社会开启免费邀测。本轮邀测将开放1000个免费名额,面向行业媒体、专家、以及感兴趣的音乐从业者开放,用户可扫描文后二维码或通过 网页填写申请 ,收到申请表后工作人员将第一时间联络回复。「天工SkyMusic」正式版也将在4月17日随「天工3.0」面向全社会免费开放。
OpenAI 放开限制,用户无需注册即可使用 ChatGPT
当地时间周一(4月1日),人工智能(AI)公司OpenAI宣布,将允许用户直接使用ChatGPT,而无需注册该项服务,这将让人们更加容易体验人工智能的潜力。OpenAI表示,它将从周一开始逐步推出这一功能,让185个国家和地区的超1亿用户使用ChatGPT来学习新事物、寻找创意灵感,并获得问题的答案。
数字生命技术公司「MyTwins.ai」完成天使轮融资
数字生命技术领域创新企业「MyTwins.ai」已于近日完成千万级人民币天使轮融资;本轮由将门创投、永禧资产、西湖科创投联合领投,元启资本担任独家财务顾问。资金将主要用于技术研发、设备采购、市场拓展等。MyTwins创办于2023年,公司致力于通过通用人工智能(AGI)技术,以为每个人创造数字分身为使命,让数字分身成为个人对外宣传、交流与服务的最佳媒介。
OpenAI 为 DALL-E 3 引入编辑功能:进一步精细化调整已生成图片
OpenAI 公司近日发布公告,宣布为 DALL-E 3 引入全新的编辑界面,在基于用户文本生成图片之后,可以继续根据用户描述精细化调整已生成的图片。DALL-E 编辑器提供两种主要编辑方法:基于选择区域的编辑和对话式编辑。
微软发布系列工具减少 Copilot “幻觉”情况,以防止生成式 AI 失控
微软公司为了遏制 Supremacy AGI(自称掌控人类世界的 AI)等事件发生,近日推出了一系列解决方案,防止生成式 AI 失控。微软首先限制了 Copilot 的字符数量,以减轻严重的幻觉发作。另外微软引入了 “基础检测”(Groundedness Detection)功能,旨在帮助用户识别基于文本的幻觉。
Sam Altman 不再拥有或控制与 OpenAI 相关的风险投资基金
根据美国证券交易委员会(SEC)的最新披露,OpenAI首席执行官Sam Altman不再拥有或控制与该公司相关的风险投资基金。控制权已转移到Ian Hathaway,自该基金2021年成立以来,他一直协助管理。OpenAI公司向媒体透露,正如之前所沟通过的,基金最初的普通合伙人(GP)管理架构是一种临时安排,并且Altman没有进行个人投资或财务利益,这一变更提供了进一步的明确性。
苹果研究人员称其设备端模型 ReALM 性能优于 GPT-4,可大幅提升 Siri 智能程度
在最近的一篇研究论文中,苹果的人工智能团队描述了一种可以显著提升 Siri 智能的模型,而且他们认为这个名为 ReALM 的模型在测试中优于 OpenAI 的知名语言模型 GPT-4.0。ReALM 的特别之处在于,它可以同时理解用户屏幕上的内容和正在进行的操作。
2024年4月1日·周一
高盛:AI将对全球经济增长产生深远影响,全球3亿个工作岗位面临“自动化”
高盛Jan Hatzius分析师团队在上周发布的研报中指出,若生成式AI能够兑现其承诺的能力,劳动力市场可能遭受巨大冲击。根据高盛对美国和欧洲职业任务数据的研究,当前美国大约有三分之二的工作在一定程度上受到AI自动化的威胁,生成式AI很有可能取代四分之一的岗位。全球范围内,生成式AI可能让3亿个全职工作岗位面临“自动化”。但与此同时,高盛指出,AI带来的“自动化”更多能通过创造新的岗位弥补它替代掉的岗位,这在很大程度上将是长期就业增长的主要来源。
百度与优必选达成合作,共同探索AI大模型+人形机器人创新应用
4月1日,百度和优必选宣布达成战略合作,共同探索中国AI大模型+人形机器人的应用,加速构建新质生产力,为人工智能和人形机器人产业的高质量发展注入新动能。
HBM需求暴增,占据90%市场份额的SK海力士市值突破千亿美元
随着投资者继续向被视为人工智能技术主要提供商的公司的股票注入现金,SK海力士的市值达到了1000多亿美元。由于其与英伟达的人工智能处理器协同使用的高带宽内存需求激增,该芯片制造商的股价在过去一年中上涨了一倍多。这使得SK海力士成为韩国第二大公司。分析人士称,SK海力士在最新版本的HBM中占有超过90%的市场份额。
DeepMind 创始人警告巨额资金涌入 AI 行业将带来炒作和欺诈
在接受媒体采访时,DeepMind 联合创始人哈萨比斯表示,这种大量资金涌入AI行业的情况,带来了一系列炒作和可能出现的欺诈行为,就像此前的加密货币或其他炒作一样。他说到:“其中有一些(炒作和欺诈)已经波及人工智能领域,我认为这有点不幸,(因为这)掩盖了这项非常了不起的科学研究。在某种程度上,人工智能的宣传还不够,但在某些方面又过于夸大其词,我们在谈论的许多事情根本就不是真的。”
美国升级对中国芯片打压,蔓延到AI PC
据路透社报道,美国拜登政府上周五以国家安全为由,修订了旨在阻止中国获取美国人工智能(AI)芯片和芯片制造设备的规定。新修订的规则阐明,面向中国的AI芯片出口管制也将适用于包含这些芯片的笔记本电脑。这次修订的新规则长达166页,将于4月4日生效。报道称,这是美国政府出于国家安全考虑而限制北京芯片制造业所做的部分努力。美国商务部表示,将计划继续更新对中国的技术出口管制,以加强和完善这些措施。
澜舟科技宣布孟子3-13B大模型正式开源,万亿token数据训练
澜舟科技官宣:孟子3-13B大模型正式开源。这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。尤其在参数量20B以内的轻量化大模型领域,在中英文语言能力方面尤为突出,数学和编程能力也位于前列。
AI 软件开发创企 Cognition Labs 寻求以至多 20 亿美元估值融资
据华尔街日报,开发AI软件工程师智能体 Devin 的初创公司 Cognition Labs 正与投资者洽谈,寻求以至多20亿美元的估值获得融资。如果按照这一估值完成融资,这笔新资金将使该初创公司的估值增至几周前的近六倍。知情人士透露,Cognition现有股东Founders Fund等硅谷风投公司正洽谈参与本轮融资。Cognition去年才开始研发自家产品,尚未产生任何有意义的收入。今年早些时候,Founders Fund领投对Cognition的一轮2100万美元的融资,对其估值为3.5亿美元。Founders Fund创始人、科技大鳄彼得·蒂尔帮助领导了对Cognition的投资。
消息称 OpenAI 将于本月在日本东京设立亚洲首个办事处
据日经新闻报道,OpenAI 将于本月(2024 年 4 月)在日本东京开设亚洲首个办事处并开始业务活动。除了为企业提供独特的服务外,OpenAI 还将参与制定正确使用生成式 AI 的规则。
马斯克称人工智能毁灭人类的可能性为 20%,但仍值得冒险
埃隆・马斯克 (Elon Musk) 在早些时候举办的 Abundance 峰会 “人工智能辩论” 研讨会上表示,即使人工智能技术有 1/5 的可能性会对人类构成威胁,但其利大于弊,我们仍然值得冒险进行研发。
三星计划在其语音助手 Bixby 中加入生成式人工智能技术
三星移动业务执行副总裁Won-joon Choi透露,该公司可能会在其语音助手Bixby中加入生成式人工智能技术;Bixby遍布该公司的设备,从智能手机和智能手表到其电器;Choi指出,该技术将使对话变得更自然,也能处理更复杂的查询。
三星组建 HBM 产能质量提升团队,加速 AI 推理芯片 Mach-2 开发
三星电子 DS 部门负责人庆桂显近日在社交媒体上表示三星内部正采取双轨 AI 半导体策略,同步提高在 AI 用存储芯片和 AI 算力芯片领域的竞争力。在 AI 用存储芯片部分,三星组建了由 DRAM 产品与技术负责人 Hwang Sang-joon 领导 HBM 内存产能与质量提升团队,这是其今年建立的第二个 HBM 专门团队。
昆仑万维:自研大模型“天工3.0”将于4月17日开启公测
昆仑万维官微宣布,自研大语言模型“天工3.0”将于4月17日正式开启公测。“天工3.0”采用4千亿级参数MoE混合专家模型,并将同步选择开源。其中,“天工3.0”AI音乐生成大模型SkyMusic还将在4月2日面向社会开启邀测。
2024年3月30日·周六
OpenAI 公布 Voice Engine 声音克隆新技术:仅需15秒音频样本即可模仿任何说话者
OpenAI 宣布推出全新的人工智能模型——“语音引擎( Voice Engine )”。这款自2022年起便默默研发的模型,如今已成为OpenAI文本转语音API以及本月早些时候发布的新版ChatGPT语音与朗读功能提供支持。事实证明,这款语音引擎还具备语音克隆的能力。其工作原理简单而高效:用户仅需通过电话或电脑麦克风录制一段15秒的声音片段,OpenAI的语音引擎便能生成“与其声音高度相似的自然语音”。
阿里通义千问团队推出 Qwen 系列的首个 MoE 模型
Qwen1.5-MoE-A2.7B 通义千问团队推出Qwen系列的首个MoE模型,Qwen1.5-MoE-A2.7B。它仅拥有27亿个激活参数,但其性能却能与当前最先进的70亿参数模型,如Mistral 7B和Qwen1.5-7B相媲美。相较于包含65亿个Non-Embedding参数的Qwen1.5-7B,Qwen1.5-MoE-A2.7B只有20亿个Non-Embedding参数,约为原模型大小的三分之一。此外,相比Qwen1.5-7B,Qwen1.5-MoE-A2.7B的训练成本降低了75%,推理速度则提升了1.74倍。
亚马逊计划推出代号为 Olympus 的旗舰人工智能模型
亚马逊向 OpenAI 竞争对手 Anthropic 投资高达 40 亿美元,同时也在押注内部将推出的大模型。据 The Verge 报道,由高级副总裁Rohit Prasad 领导的亚马逊 AGI 团队有一个雄心勃勃的目标,即在今年年中超越 Anthropic 最新的 Claude 模型。其即将推出的旗舰模型,内部代号为 Olympus,正在训练中,并且规模相当大,拥有数千亿个参数。
因担心“泄密”,美国众议院禁止工作人员使用微软Copilot
据当地媒体报道,美国众议院目前已严禁国会工作人员使用微软的Copilot生成式人工智能助手;众议院担心Copilot有可能将众议院的数据,泄露到未经众议院批准的云服务中;微软方面则回应称,希望未来不久即将推出的政府版AI工具套件能够解决国会的关切。
微软和OpenAI计划投资1000亿美元建造“星际之门”AI超级计算机
据The Information报道,微软和OpenAI计划投资1000亿美元建造“星际之门”(Stargate)AI超级计算机。OpenAI的下一版重大人工智能升级预计将在明年初落地。微软高管希望最早在2028年发布“星际之门”(Stargate)AI超级计算机。此外,微软和OpenAI计划为AI开发数据中心项目。
2024年3月29日·周五
OpenAI 向派拉蒙、环球和华纳兄弟探索等展示其视频生成技术 Sora
据英国《金融时报》报道,OpenAI 与派拉蒙(Paramount)、环球(Universal)和华纳兄弟探索(Warner Bros Discovery)等好莱坞工作室举行了会议,展示其视频生成技术 Sora 。多位知情人士透露,OpenAI 的首席执行官 Sam Altman 和首席运营官 Brad Lightcap 向电影业巨头的高管进行了演讲。参加会议的人士表示,OpenAI 正在寻求电影老板对如何推出 Sora 的意见。一些观看演示的人表示,他们可以看到 Sora 或类似的人工智能产品如何节省制作时间和金钱,但他们补充说,这项技术需要进一步开发。
周鸿祎透露将开源360智脑7B模型,支持50万字长文本输入
360集团创始人周鸿祎日前在直播中透露,即将开源360智脑70亿参数模型,支持360K即50万字长文本输入。“前段时间大模型行业卷文本长度,很快100万字就是标配了。我们打算将这个能力开源,大家没必要重复造轮子。定360k主要是为讨个口彩。”周鸿祎称自己是开源的信徒,信奉开源的力量。据了解,360k在国内目前开源的长文本能力中最长。
消息称数据标注独角兽 Scale AI 正进行新一轮融资谈判,估值接近 130 亿美元
据 The Information 报道,知情人士透露,数据标注初创公司 Scale AI 的早期投资者风险投资公司 Accel 正在就领投其新一轮融资进行谈判,这将使该初创公司的估值提高近 80%,达到约 130 亿美元。其中一位知情人士表示,为人工智能模型标注图像或文本的 Scale AI 正在洽谈本轮融资数亿美元。此前,媒体曾报道 Scale AI 2023年的年化收入达到 7.5 亿美元,为前一年的 3 倍。
马斯克旗下 xAI 推出 Grok-1.5,上下文长度至 128k、HumanEval 得分超 GPT-4
此前,马斯克旗下 xAI 开源了 Grok-1 模型,今天又宣布 Grok 大模型升级到 1.5 版本,新版 Grok 在两个方面有重大升级:一是上下文长度飙升,从8192增长到128k,和GPT-4齐平。二是推理性能大幅提升,数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4。
小米 SU7 搭载 AI 大模型:小爱同学秒识前车车型
昨日晚间,小米汽车首款车型小米SU7震撼登场,标志着科技巨头小米正式迈入新能源赛道。据介绍,小米SU7搭载AI大模型,配合小爱同学语音助手带来全新智驾体验。官方统计,小爱同学发布7年,具有1.1亿月活动用户,每天2.08亿次激活。
SimilarWeb:OpenAI 的 GPT 商店上的自定义 GPTs 仅占 ChatGPT 网站桌面访问量的 1.5%
根据网站数据分析工具SimilarWeb的数据,今年2月份,用户创建的个性化GPT仅占ChatGPT网站访问量的1.5%,并且每周的流量也已经趋于稳定,似乎不太可能会突然冲高。数据显示,一些声称可以预测股价走势和躲避剽窃检测的聊天机器人在OpenAI的应用商店中比较受欢迎。分析认为,这些数据揭露了数百万人使用生成式人工智能的实际目的。在浏览量最高的GPT中,有五个称其生成的内容可以绕过学校的检测工具,让校方无法确定论文和答案是否是由人工智能生成的。
Meta 下月将为 Ray-Ban 智能眼镜带来一系列 AI 功能:物体识别、翻译等
据《纽约时报》报道,下个月开始,Meta 将为其 Ray-Ban 智能眼镜带来一系列多模态 AI 功能,这些功能包括翻译、物体识别、动物及景物识别等等,已于去年 12 月进入早期测试阶段。用户只需说出“Hey Meta”并说出提示词或提出问题,便可激活该眼镜内置的 AI 助手,随后再通过镜框内置的扬声器进行回应。
谷歌即将在 Pixel 8 上推出设备端人工智能功能,基于 Gemini Nano
谷歌今天宣布,很快将在 Pixel 8 上推出设备端人工智能功能,例如记录摘要和智能回复。这些功能将基于谷歌去年发布的小型模型 Gemini Nano ,准备运行在设备上。此前,由于“硬件限制”,谷歌曾表示 Gemini Nano 仅会由 Pixel 8 Pro 搭载。目前看来,谷歌找到了一种可以在更少 RAM 上运行大模型而又不影响其他用户体验的方法。
2024年3月28日·周四
亚马逊未来15年或斥资1480亿美元在全球建设并运营数据中心
据统计,在过去两年内,亚马逊已承诺未来15年斥资1480亿美元在全球建设和运营数据中心。该公司计划扩建美国弗吉尼亚州和俄勒冈州的现有枢纽,并向密西西比州、沙特和马来西亚等新地区推进。研究公司Dell’Oro Group表示,在亚马逊广泛削减成本的情况下,亚马逊云科技(AWS)的数据中心资本支出在2023年缩减2%,微软则将相关支出提高50%以上。但亚马逊首席财务官奥尔萨夫斯基上月表示,公司今年将增加资本支出以支持AWS的增长,包括人工智能相关项目。
百度高管回应“与苹果合作”:我们已有一个案例,与终端厂商合作很有潜力
博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行。在28日下午举办的《融合与创新的数字经济》分论坛上, 百度集团执行副总裁、百度智能云事业群总裁沈抖在接受新浪科技采访时回应了与苹果的合作,沈抖表示,我们与终端厂商的合作已经有很多案例了,比如荣耀、三星等等,我觉得与终端厂商的合作还是很有潜力的。
英伟达 AI 芯片 H200 开始供货,性能相比 H100 提升 60%-90%
据日本经济新闻今日报道,英伟达的尖端图像处理半导体(GPU)H200 现已开始供货。H200 为面向 AI 领域的半导体,性能超过当前主打的 H100。根据英伟达方面公布的性能评测结果,以 Meta 公司旗下大语言模型 Llama 2 处理速度为例,H200 相比于 H100,生成式 AI 导出答案的处理速度最高提高了 45%。
白宫要求美国各联邦机构设置“首席人工智能官”,确保 AI 使用情况公开透明
据彭博社报道,美国行政管理与预算局当地时间 28(今)日发布指令,要求各联邦机构监测、评估和测试人工智能对公众的影响,减轻算法歧视及侵犯隐私的风险,并提高政府使用人工智能技术的透明度。
商汤科技:2023年上线GPU达45000个,生成式AI业务为重点发展方向
近日,商汤科技召开业绩交流会。董事长兼首席执行官徐立在会上表示,2023年实施了大装置+大模型的产业布局。算力规模上,大装置的运营总算力突破了12000P,P即Petaflops,相较于23年初提高了一倍。上线的GPU数量达到了45000个。与此同时,在大模型的能力上,集团的日日新大模型性能快速提升,实现了万卡万参的大模型训练能力,在基模型、多模态、编程和工具调用、百万字无损上下文以及终端小模型,都达到了国内的领先水平。
IDC:中国生成式AI投资增长加速 五年复合增长率达86.2%
IDC于近日发布了2024年V1版IDC《全球人工智能和生成式人工智能支出指南》。IDC数据显示,2022年全球人工智能(AI)IT总投资规模为1324.9亿美元,并有望在2027年增至5124.2亿美元,年复合增长率(CAGR)为31.1%。聚焦生成式AI(Generative AI),IDC调查发现,到 2027 年45% 的企业将掌握并使用生成式 AI 来共同开发数字产品和服务,从而使收入增长比竞争对手翻一番。IDC预测,全球生成式AI市场年复合增长率或达85.7%,到2027年全球生成式AI市场规模将接近1500亿美元。
钉钉 AI 助理升级:加入多模态、工作流等能力
钉钉 AI 助理宣布升级,上线图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与 RPA 技术在 AI 应用的落地。基于阿里通义千问大模型,升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力。目前,用户在钉钉 IM 消息框或点击魔法棒按钮进入 AI 助理对话框,发送长文件、在线文档、网页链接、视频内容,即可根据内容识人、识地点、分析、答题、翻译、摘要、提取文字,甚至可以通过多轮交互进一步做智能问答。
阿里云与联发科合作,天玑 9300 等手机芯片适配端侧通义千问大模型
联发科宣布已成功在天玑 9300 等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配。通义千问在离线情况下运行多轮 AI 对话。阿里云方面表示,将和联发科深度合作,向全球手机厂商提供端侧大模型解决方案。
亚马逊向人工智能初创公司 Anthropic 追加 27.5 亿美元投资
亚马逊正在进行其三十年来最大的外部投资以在人工智能竞赛中获得优势。该科技巨头今天表示,将再斥资 27.5 亿美元支持 Anthropic,这是一家总部位于旧金山的 AI 初创公司,被视为生成人工智能领域的领跑,其基础模型和聊天机器人 Claude 与 OpenAI 和 ChatGPT 竞争。两家公司于去年 9 月宣布初始投资 12.5 亿美元,并表示亚马逊将投资至多 40 亿美元。Anthropic 表示,亚马逊将保留该公司的少数股权,并且不会拥有 Anthropic 董事会席位。据消息人士透露,这笔交易是在 Anthropic 公司的最新估值为 184 亿美元的情况下达成的。
Databricks 开源推出企业级大模型 DBRX,性能超越 LLaMA2 等开源模型
数据云平台 Databricks 宣布并开源发布了自家大模型 DBRX 的模型权重,在各种基准测试中均优于现有的开源模型。该公司的目标是为寻求利用生成式人工智能力量的企业提供高质量、可定制的人工智能。DBRX 在语言理解、编程、数学和逻辑任务方面超越了 LLaMA2-70B、Mixtral 和 Grok-1 等模型。根据 Databricks 的开源基准测试 Gauntlet,DBRX 在 30 多个不同的最先进基准测试中处于领先地位,展示了开源模型质量的持续改进。
2024年3月27日·周三
百度智能云推出大模型应用全家桶7款产品全新升级
3月27日,百度智能云在北京首钢园召开“AI Cloud Day:大模型应用产品发布会”,面向企业营销、对客服务、知识管理、数据洞察、代码编程等多个企业通用场景,将大模型能力全面融入7大产品,包含百度智能云曦灵数字人平台、百度智能云客悦智能客服平台、百度Comate代码助手等,不仅提供公有云、私有云两大使用方式,还为企业打包提供“应用产品全家桶”,全面助力企业业务增长、提升运营效能。
为机器人提供“通用大脑”,「X Square」连续完成数千万元天使轮与天使+轮融资
具身智能大模型初创企业“X Square”近期连续完成了由联想之星投资的数千万元人民币的天使轮融资,和由九合创投领投的数千万元人民币的天使+轮融资,一苇资本担任X Square独家财务顾问。成立于2023年12月,X Square聚焦于“通用具身大模型”的研发,为机器人提供通用大模型底座。公司的目标是为机器人构建一个通用的大脑-小脑系统,提供从感知到动作的端到端能力。
马斯克:人形机器人成本不到汽车的一半
特斯拉 CEO 埃隆・马斯克周二表示,制造人形机器人 Optimus 的成本仅为特斯拉电动汽车的一半。马斯克在社交平台表示,“人形机器人虽然单位质量的复杂程度更高,但最终的制造成本我认为仍然会低于特斯拉汽车的一半。”马斯克的这番话是对 ARK Invest 的自动驾驶和机器人技术研究主管 Sam Korus 的回应,Korus 认为,与汽车相比,阻碍人形机器人大规模量产的因素主要在于软件能力,而非制造本身。
英国智库:AI转型需要加以控制,否则800万人将失业
英国智库公共政策研究所(IPPR)的一项新研究指出,企业向人工智能的转型最糟可能会导致近800万人失业;IPPR呼吁政府制定框架,以尽量减少对劳动力市场的破坏;该智库还称,若对该技术加以管控,那么英国经济能够充分受益于人工智能。
LG集团未来五年将在韩投资约100万亿韩元,用于人工智能、电池、汽车零部件等
韩国LG集团3月27日举行股东大会,发布中长期投资规划称,将在截至2028年的五年间对韩国本土进行约100万亿韩元(约5350亿人民币)规模的投资,其中一半将用于人工智能、生物、清洁技术等未来技术以及电池、汽车零部件、新一代显示器等领域,致力于塑造竞争力。LG集团表示,将把投资额的55%用于科学研究与试验发展方面,在韩国本土打造关键材料研发中心和智能工厂等核心制造基地。
创新奇智宣布工业大模型升级,参数量级突破750亿
创新奇智举办奇智孔明工业大模型升级发布会暨大模型技术应用研讨活动。会上,奇智孔明工业大模型2.0版本(AInno-75B)及多款大模型原生应用发布。本次升级后的奇智孔明工业大模型在参数量级上实现了新突破,达到750亿以上,不仅巩固了其在工业知识问答、数据分析、代码生成、任务编排等方面的能力,更进一步增强了海量知识管理、复杂逻辑推理、长流程任务编排、Agent智能体以及更多工业模态的生成能力。
聚焦AI战略,苹果本届全球开发者大会将于6月10-14日举办
苹果公司今日宣布,其第35届全球开发者大会(WWDC)将于6月10日(周一)至14日(周五)在线举行。据悉,苹果公司计划在WWDC上提供在线会议和实验室,旨在帮助开发者了解将在大会上公布的新功能和软件。苹果将于6月10日举办主题演讲,届时将展示iOS 18、iPadOS 18、tvOS 18、macOS 15、watchOS 11和visionOS 2等新版本操作系统。据媒体报道,本届大会的焦点预计是苹果的AI战略。WWDC被认为是苹果展示其AI领域最新进展的最佳平台。同时,该大会还可能揭示有关iPhone与谷歌Gemini合作的详情。
机构预估 OpenAI 部署文生视频模型 Sora 需要 72 万张英伟达 H100:价值 216 亿美元
市场调查机构 Factorial Funds 近日发布报告,认为 OpenAI 部署文本转视频模型 Sora,在峰值期需要 72 万张英伟达 H100 AI 加速卡。Factorial Funds 预估训练 Sora 1 个月,需要使用 4200 到 10500 片英伟达 H100 AI 加速卡,如果使用单片 H100 加速卡,生成 1 分钟视频需要渲染 12 分钟。
麻省理工大学携手 Adobe 演示 DMD AI 技术:每秒可生成 20 幅图像
主流文生图模型固然已经能生成非常逼真的图片,但通常渲染时间非常缓慢。麻省理工大学携手 Adobe 公司近日研发了 DMD 方法,在尽量不影响图像质量的情况下,加快图像生成速度。DMD 技术的全称是 Distribution Matching Distillation,将多步扩散模型简化为一步图像生成解决方案。研究人员称,他们的模型可以在现代 GPU 硬件上每秒生成 20 幅图像。
抖音发布不当利用AI生成虚拟人物的治理公告,严格处罚相关违规内容
去年,抖音发布《关于人工智能生成内容的平台规范暨行业倡议》,明确平台不鼓励利用AI生成虚拟人物进行低质创作,将严格处罚违规使用AI生成虚拟人物发布违背科学常识、弄虚作假、造谣传谣的内容。近期平台发现,站内仍有不当使用AI技术生成虚拟人物发布内容的账号,平台进行了严厉处置。
马斯克宣布所有X Premium用户本周将获得AI聊天机器人Grok的访问权限
继埃隆-马斯克(Elon Musk)的 xAI 在 3 月早些时候开源其 Grok-1 大型语言模型之后,这位 X 的所有者周二表示,X 将很快向更多付费用户提供 Grok AI 聊天机器人。马斯克在 X 上发布的一篇帖子中宣布,Grok 将于本周向Premium用户开放,而不是像以前那样只向更高端的Premium+用户开放。
SK海力士欲斥资40亿美元赴美建厂扩张HBM存储产能以满足英伟达庞大需求
据媒体援引知情人士透露的消息报道称,来自韩国的存储芯片巨头SK海力士(SK Hynix)计划投资大约40亿美元,在美国印第安纳州西拉斐特(West Lafayette)新建大型的先进芯片封装工厂,力争扩张HBM存储产能以满足英伟达庞大需求。知情人士表示,该大型先进封装工厂可能于2028年开始运营。SK海力士为英伟达高性能AI GPU——H100 HBM存储系统的独家供应商,此外,SK海力士当前已开始全面量产集成英伟达AI GPU的新一代HBM存储——HBM3E,首批出货将于本月交付给AI芯片霸主英伟达。
知情人士称苹果与百度尚未达成 AI 合作
近日有媒体报道称,百度将为苹果今年即将发布的 iPhone16、Mac 系统和 iOS 18 的国行版提供 AI 功能。现据中国日报报道,对此,接近苹果公司的知情人士向记者予以否认,表示双方尚未达成合作。
微软任命 Suleyman 为 AI 新主管后,Parakhin 不再担任必应负责人
微软必应和广告业务的负责人Mikhail Parakhin将退出这些职务,寻找新的岗位。一周前,微软任命 DeepMind 和 Inflection AI 联合创始人 Mustafa Suleyman 负责消费者人工智能(AI)业务,并要求Parakhin向其汇报工作。Parakhin的退出标志着微软首席执行官Satya Nadella上周任命Suleyman担任统一推进这块业务的负责人后,引发的首次高层洗牌。两位知情人士上周表示,此举表明Nadella对Parakhin团队的进展已没有耐心。过去一年中,必应在与谷歌的竞争中几乎没有取得什么先手,其他产品也仍在开发中。
2024年3月26日·周二
工信部谈新质生产力:加快推动以大模型为代表的AI赋能制造业发展
工业和信息化部新闻发言人、总工程师赵志国今日在国新办新闻发布会上表示,下一步,将着力提升产业科技创新能力。加快推动以大模型为代表的人工智能赋能制造业发展。今年将开展“人工智能+”行动,促进人工智能与实体经济深度融合,推动人工智能赋能新型工业化。
快手:快意通用大语言模型能力已超GPT-3.5,营销能力齐平GPT-4
快手商业化算法负责人江鹏在2024快手磁力大会上表示,快意通用大语言模型能力超过GPT-3.5,通过对快意大模型进行千亿级Token商业知识预训练、百万级商业指令对齐等,快手进一步研发了业界领先的营销域大语言模型,该模型能生成真正符合快手风格的素材,在营销领域的能力已与GPT-4齐平。快手女娲数字人平台能支撑超过2200路数字人24小时同时开播,盘古视频AIGC能够让营销转化率提升33%。
博鳌论坛:人工智能的迅速发展将为亚洲发展与合作提供新的机遇
博鳌论坛2024年年会上,《亚洲经济前景及一体化进程2024年度报告》正式发布。报告指出,人工智能的迅速发展正在深刻改变人类社会生活、改变世界,将为亚洲发展与合作提供新的机遇。人工智能正由“用计算机模拟人的智能”转向“机器+人”、“机器+人+网络”和“机器+人+网络+物”三个方向。人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,不仅显著提高了生产率,而且在持续改善人类福祉方面潜力巨大。但是,人工智能也不可避免地在就业、财富分配、合规使用等方面带来有意或无意的附带影响。如何合理开发和利用人工智能正成为亚洲各国合作的重要课题。
OpenAI 官方公布 Sora 初期合作试用反馈
OpenAI 的新文本到视频模型 Sora 仍处于早期阶段,但第一批艺术家和创意人员已经在测试它。OpenAI 现在发布了 Sora 创造性使用的一些印象。自一个月前有限推出 Sora 以来,OpenAI 一直与视觉艺术家、设计师、创意总监和电影制作人合作,找出如何将 Sora 融入到他们的创作过程中。该公司现在在其 Sora: First Impressions 博客 上分享了使用 Sora 的一些早期经验和感想。
消息称苹果正准备在 WWDC 2024 上推出 AI 应用商店
根据目前已知信息,苹果将会在 WWDC 2024 为大家展示这些全新融入 AI 元素的系统和软件。不过,苹果的 AI 策略可能不仅仅只是局限于自家 AI 应用,而是为开发者和用户提供一个更大的平台,从而能够使其更好地从中获利。Melius Research 主管 Ben Reitzes 周一在接受 CNBC 采访时表示,苹果可能会在 6 月份 WWDC 上推出一个全新的 AI 应用商店,预计将包括各大供应商提供的 AI 应用。
高通、谷歌和英特尔等计划联合开发新的 AI 套件以打破英伟达 CUDA 的统治地位
近期包括高通、谷歌和英特尔等科技巨头,正计划通过开发一套能够支持多种AI芯片的软件和系统化工具,来打破英伟达在AI领域的软硬件主导地位。这个项目名为UXL,旨在创建一个开放源代码的AI软硬件生态系统,使计算机代码能够在任何芯片架构和任何硬件上运行,从而解决目前由少数几家芯片公司所主导的AI生态。此外,鉴于英伟达CUDA平台影响力无比庞大,UXL还计划长期支持英伟达的硬件和代码,这一行动意在促进“AI硬件选择的多样性”以及提高开发效率。
莫言:AI 不会让文学消亡,作家这个职业也不会就此终止
作家莫言在个人微信公众号发文表示:“文学,是人类历史上,人类进步到一个相当高的阶段之后才出现的现象。我从80年代开始写作的时候,就听到过很多给文学敲警钟的言论:随着电视、随着网络的出现,文学的未来岌岌可危,文学的命运可能就要终结等等。但事实证明,文学永远不会随着科学的进步而消亡,而且只能是每一次科学的进步都会给文学插上新的翅膀。所以我也相信,现在AI的出现,也不会让文学产生多么大的危机,作家这个职业也不会就此终止。在很长一段时间内,作家独具个性的形象、思维,是AI无法替代的。所以在有生之年,我们是不会失业的,我们的创作还会让电子计算机无法模仿。
特斯拉招聘人形机器人 Optimus 用户手册撰写员,明年开始交付
特斯拉正在招聘一位服务技术撰写员(Service Technical Writer),专为其人形机器人 Optimus 编写用户手册。此举暗示着特斯拉人形机器人项目取得了重大进展,并且可能比预期进度更快实现量产。在 2023 年第四季度财报电话会议上,埃隆・马斯克估计将在 2025 年左右开始向客户交付少量特斯拉人形机器人。特斯拉近期发布的与 Optimus 相关的招聘信息暗示着,公司正按计划朝着马斯克的预期目标迈进。
消息称 Meta 正积极开展 AI 人才战:候选人无需面试,扎克伯克下场招募
据 The Information 北京时间今晚报道,为了在争夺人工智能研究人员方面取得更大优势,Meta 正在采取一系列“非常规举措”,进一步加大了这场 AI 人才战的火药味。报道称,这一系列的举措包括在不面试候选人的情况下向他们提供工作机会等,更为此前威胁离职的员工增加薪资 —— 在此之前,Meta 的“长期做法”是不加薪。另据两位查看过 Meta 相关邮件的人士透露,公司首席执行官马克・扎克伯格亲自写信给谷歌 DeepMind 部门的研究人员,想要将其纳入麾下,表明这家社交媒体公司“非常重视”AI 人才的竞争。
2024年3月25日·周一
诺奖得主皮萨里德斯:AI不会取代绝大多数工作,年轻人要重新思考就业技能
3月24日至25日,中国发展高层论坛2024年年会在北京举行,伦敦政治经济学院教授、2010年诺贝尔经济学奖获得者克里斯多夫·皮萨里德斯皮萨里德斯在会议间隙接受了21世纪经济报道记者的独家专访。他在采访中表示,就其对劳动力市场的影响范围而言,生成式AI可能会超过计算机。但他也表示,尽管AI的技术发展速度很快,但它的大规模的应用还要一段时间。
Zoom 推出人工智能驱动的统一协作平台 Zoom Workplace
Zoom 宣布推出 Zoom Workplace ,这是一款全新的人工智能协作平台,可将多种关键解决方案整合到一个统一的中心中,旨在支持企业重新构想团队合作、促进联系、提高生产力并优化灵活的工作体验。借助 Zoom AI Companion,公司内的所有员工都可以提高生产力、更有效地协作并提高他们的技能。
字节提速AI:Flow部门下设四大业务线,挖角大批百度阿里员工
近日,字节跳动推出AI角色互动App“话炉”,从而引发外界对其探索AI社交赛道的关注。据了解,“话炉”由字节跳动的Flow部门打造。新浪科技独家获悉,Flow部门隶属于字节跳动的产品研发与工程部(内部简称“PDI”),目前下设四大业务线,包括AI教育、国际化、社区和豆包,“话炉”则属于社区业务线旗下。
百度将为苹果今年国行 iPhone 16 等设备提供 AI 功能
《科创板日报》记者从知情人士处了解到,百度将为苹果今年发布的iPhone16、Mac系统和iOS18提供AI功能。苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定由百度提供这项服务。苹果预计采取API接口的方式计费。苹果将国行iPhone等设备采用国产大模型AI功能主要出于合规需求,该公司短期内还无法解决合规问题,但国外版iPhone等设备AI功能均来自苹果自己的大模型。
2024胡润全球富豪榜发布,一半以上的新增财富来自于AI
3月25日,胡润研究院发布《2024胡润全球富豪榜》。全球共有3279位十亿美金企业家,比去年增加了167位,增幅为5%。中国仍是世界上十亿美金企业家最多的国家,有814位,美国紧随其后,有800位。值得一提的是,AI今年第一次深度影响全球富豪榜,一半以上的新增财富是来自于AI。Meta、亚马逊、谷歌母公司Alphabet、甲骨文、微软等云计算相关的企业家财富大幅增长。英伟达的黄仁勋第一次财富明显增长,进入全球前30。
消息称苹果 iOS 18 系统因用户隐私处理问题,或放弃提供生成式 AI 服务
据媒体报道,知名科技记者马克·古尔曼(Mark Gurman)在最新一期通讯中表示,苹果有可能会放弃在iOS 18中提供生成式AI服务。古尔曼表示,预计在今年的开发者大会上,苹果在发布iOS 18时将花费大量时间介绍它如何看待和整合AI,其中包括苹果认为应该如何整合这种技术。古尔曼称其得知苹果仍在研究在利用人工智能中的隐私问题,而且苹果的内部计划将比竞争对手的计划更加保守。因此苹果最终可能会决定放弃与谷歌等其它公司合作,不在iOS 18中提供生成式AI服务。
图灵奖得主希发基思:AI目前只有弱人工智能能力
3月24日,在北京钓鱼台国宾馆举行的中国发展高层论坛上,图灵奖得主约瑟夫·希发基思(Joseph Sifakis)在人工智能发展与治理的讨论中发表了演讲。希发基思认为,尽管人类在人工智能研究中取得了长足的进步,并迎来了生成式AI,但目前应用只是弱智能(weak AI),集中在问答应用上,并没有能够同步人工智能能力的技术和法则。
无人驾驶重载AGV初创公司「朗誉机器人」获数千万元A+轮融资
重载AGV厂商「朗誉机器人」日前完成数千万元A+轮融资,本轮融资由曈辉创投领投,中车(青岛)创投跟投。融资资金将用于产能及市场拓展。重载AGV主要用于搬运或装配重型部件,具备载重大、技术难度高等特点,在风电、机械重工等领域广为使用。朗誉机器人自2018年起进入重载AGV领域,迄今已有多款重载AGV落地实用,载重可达数百吨级,无人矿卡等产品也已完成研发。
冷链智能机器人初创公司「粤十机器人」获数千万元Pre-A2轮融资
近日,「粤十机器人」获得数千万元Pre-A2轮融资,投资方为金沙江联合资本。本轮融资资金将用于产品研发、订单交付、团队拓展以及出海布局,极值资本担任长期财务顾问。而这已经是这家公司成立半年内的第五轮融资。「粤十机器人」是一家冷链机器人智能云平台公司,由北京大学、浙江大学、香港大学博士团队联合创办,将人工智能、环境感知、深度学习、伺服控制等核心技术专利应用于工业无人驾驶领域,为客户提供冷链无人工厂、机器人云平台及冷链智能机器人等全方位的智能化解决方案。
2024年3月24日·周日
OpenAI 申请 Voice Engine 新商标,或将开发一款 AI 个人助理
OpenAI 正在申请一个新商标 Voice Engine,商标的覆盖范围主要是围绕语音识别、语音合成和语音生成几个方面。这暗示着 OpenAI 可能即将推出围绕语音引擎开发的产品或者服务,很有可能是类似 Siri 那样的个人助理产品。尽管这是商标申请,但是谷歌前雇员透露的信息以及上个月泄露的 OpenAI 正在开发的 Agent 产品都似乎印证着 OpenAI 要做的事情:开发一个全球最强的个人助理,接管个人设备,以 Jarvis 那样的形式提供服务!此前,谷歌前雇员 Jonathan Chavez 在 X 平台上也发布过一个消息,他说 OpenAI 在今年会推出一个全球最好的个人助理产品,就像钢铁侠中的 Jarvis。
消息称 AI 视频生成初创公司 HeyGen 正进行 6000 万美元新一轮融资,投前估值 4.4 亿美元
据外媒 The Information 最新报道, HeyGen 目前正在筹集 6000 万美元,按照投资前估值 4.4 亿美元进行融资,该估值是四个月前该公司估值的六倍,最新一轮融资由 Benchmark 领投,曾早期投资过 Snap 和 Uber。去年 11 月,海外知名 VC Sarah Guo 创立的 Conviction 领投了上一轮。HeyGen 原名 Surreal,在 2020 年疫情期间,由前 Snap 软件工程师 Joshua Xu 以及前字节产品设计师 Wayne Liang,于 2020 年底创立,根据 LinkedIn,它大约有 40 名员工。
口袋便携式 AI 设备 Rabbit R1 月底向首批美国买家发货
曾在今年 CES 大展期间引起轰动的口袋 AI 设备 ——Rabbit R1 将要发货了。Rabbit 官方周六宣布,正在按计划于 3 月 31 日复活节当天将首批美国用户订购的产品运出工厂。由于订单需通过海关,预计发货时间超过 3 周,首批订单将于 4 月 24 日左右到达当地客户手中。“我们迫不及待,想要让您亲身体验 R1!”
经济日报:进一步利用AI、大数据、5G等先进技术赋能大健康产业
经济日报发文表示,面对健康消费领域的新趋势、新特点,行业需要立足大健康产业布局,以高质量供给满足健康消费需求。业内人士认为,企业应加快产品研发创新更迭,更加精准地为消费者提供定制化的健康产品和服务。加速体育健身、健康家居、智能穿戴等新产品迭代,进一步利用AI、大数据、5G等先进技术赋能大健康产业,推动在线问诊、远程医疗等新业态发展。此外,要借助新技术、新经济等现代生产方式和经营模式,匹配更多健康消费新场景,扩大产品和服务的供给。
纽约时报:中国培养了全球近半顶尖AI人才,美国仅有18%
据《纽约时报》当地时间3月22日报道,尽管美国在生成式人工智能(AI)领域率先取得突破,但在AI尖端人才培养这项“关键指标”的竞赛上,中国已经领先美国成为全球第一。报道称,研究表明,从某些指标来看,中国已经超越美国成为AI人才的最大出产国。根据美国保尔森基金会旗下的麦克罗波洛智库(Macro Polo)的最新研究,从出身的本科院校来看,中国高校几乎培养了全球一半的顶尖AI研究人员,相比之下,仅有约18%研究人员来自美国大学。
2024年3月23日·周六
OpenAI 前商业化负责人:AGI 将在 2030 年前实现
“我与AI共同成长了14年,现在我基本上确定AGI(通用人工智能)的时代要来了。”在今日开幕的2024全球开发者先锋大会上,OpenAI前全球商业化负责人扎克·卡斯带来了题为《AI向善》的演讲。卡斯是OpenAI的商业化推手,在他的努力下,ChatGPT在两个月内月活用户突破1个亿,成为史上用户增长速度最快的应用程序。
华为发布首个区域天气预报AI模型“智霁”1.0,深圳3公里精准预报
在今天世界气象日的“气候行动最前线”主题活动上,华为云与深圳市气象局共同发布了首个人工智能区域预报模型——“智霁”1.0,标志着气象预报迎来了新的里程碑。这一区域模型以华为云盘古气象大模型为基础,融合了区域高质量气象数据集,能够迅速地为未来5天深圳及周边地区提供空间分辨率为3公里的预报,包括气温、降雨、风速等气象要素。
沈向洋:通用大模型时代,重新思考人机关系
美国国家工程院外籍院士沈向洋表示,大模型将横扫所有垂直行业,并且如果要达到通用模型的性能,都会去到万卡、上万亿参数的规模。他提出,未来最具吸引力的发展方向可能是个性化的个人大模型,而将个性化参数与云计算和端设备相结合,将开创出极具价值的新局面。
360 AI浏览器APP即将上线:支持500万字长文本处理
今天360智脑宣布正式内测500万字长文本处理功能,该功能即将入驻360AI浏览器。此外,360AI浏览器APP也即将上线。据悉,此前360AI浏览器在2月29日已向用户免费开放100万字长文本阅读功能,可一分钟读完《三体》,并就文本外的“超纲”问题进行问答和延展学习,此次长文本处理能力进一步提升,将大幅提升用户使用体验。
Stability AI 首席执行官辞职,要专注开发去中心化 AI Stability
AI 公司创始人、首席执行官埃马德・莫斯塔克(Emad Mostaque)本周五宣布,已经卸任不再担任公司 CEO,且会辞去公司董事会职务。Stability AI 公司在一篇博客文章中说,该公司得到了包括光速创投(Lightspeed Venture Partners)和 Coatue Management 在内的投资者的支持,目前还没有首席执行官的长期替代人选,但已任命首席运营官黄珊珊(Shan Shan Wong)和首席技术官克里斯蒂安-拉福特(Christian Laforte)担任临时联席首席执行官。
Neuralink脑机接口首位受试者用意念在X上发帖,马斯克转发回应
马斯克旗下脑机接口公司Neuralink的首位芯片植入受试者诺兰·阿博用意念操作,发布了他在X平台(原推特)上的首条帖子。他在帖子中幽默的表示:“推特封杀了我,因为他们认为我是个机器人,X和埃隆·马斯克恢复了我,因为我就是。”马斯克转发了这条帖子,并写道:“通过意念发出的第一条帖子,使用Neuralnk心灵感应装置!”据悉,诺兰·阿博是一位位四肢瘫痪患者,通过脑机接口已经实现了靠意念打字、玩游戏等,Neuralink此前还公布了他用意念下象棋的视频。
消息称 OpenAI 劲敌 Anthropic 正寻找新投资者,先把沙特排除了
据国外媒体报道,财力雄厚的主权财富基金正竞相入股炙手可热的人工智能初创公司Anthropic,这家公司与OpenAI展开了激烈的竞争。然而,沙特却被Anthropic公司明确排除在投资名单之外。据知情人士透露,在银行家们忙于寻找一批新的潜在投资者之际,Anthropic公司拒绝了沙特的投资意向。其中一位消息人士透露,Anthropic的高管们给出的理由是出于对国家安全的担忧。
OpenAI 拟携 Sora 进军电影市场,安排下周与电影工作室和导演们开会
周五有媒体报道称,OpenAI将在下周前往洛杉矶,与一众好莱坞电影公司、媒体行业高管和经纪公司展开会面。主要目的有二:首先是在娱乐行业建立合作关系,同时鼓励电影制片人将Sora工具融入到他们的创作流程中。
财跃星辰发布国内首个千亿参数多模态金融大模型
国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”今日在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训练,具备强大的通用图像处理和图表理解能力,相比GPT-4等通用大模型在金融知识理解方面更为突出。财跃星辰由上海报业集团旗下界面财联社与国内头部通用大模型公司阶跃星辰联合创办,前微软全球副总裁姜大昕任首席科学家。
阶跃星辰发布Step-2万亿参数MoE语言大模型预览版
在今日上海开幕的2024全球开发者先锋大会上,通用大模型创业公司阶跃星辰正式对外亮相。阶跃星辰研发的Step-1V 千亿参数多模态大模型,在中国权威的大型模型评估平台“司南”(OpenCompass)多模态模型评测榜单中位列第一,性能比肩 GPT-4V。阶跃星辰创始人、CEO姜大昕博士在大会上正式对外发布了Step-2万亿参数MoE语言大模型预览版。模型采用 MoE 架构,聚焦深度智能的探索,并提供API接口给部分合作伙伴试用。(注: 冒泡鸭 和 跃问 两款产品便是由阶跃星辰推出)
云计算供应商 Coreweave 洽谈按 160 亿美元估值融资
据知情人士透露,云计算提供商CoreWeave正在就股权融资进行谈判,该融资将使其估值增加一倍以上,达到160亿美元。该公司是当前人工智能竞赛中最热门的初创公司之一。该公司正在讨论出售新股和现有股票,员工可能会出售部分持股。其中一位知情人士提醒说,协议条款尚未敲定,仍有可能发生变化。
消息称苹果在中国与百度就 iOS 18 生成式 AI 合作进行谈判
据华尔街日报报道,苹果公司正与百度就其生成式人工智能模型进行合作洽谈,这可能是为了满足国内 iPhone 用户的人工智能需求,国内法律法规要求此类模型在使用前必须经过监管机构的批准。
2024年3月22日·周五
百度即将免费开放200万-500万长文本能力
《科创板日报》记者从知情人士获悉,百度文心一言下个月将进行版本升级,届时也将开放长文本能力,文字范围会在200万-500万。目前,文心一言的文本上限大致在2.8万字。
阿里通义千问升级:免费开放 1000 万字长文档处理功能
阿里通义千问宣布升级,向所有人免费开放 1000 万字的长文档处理功能。所有金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和 App 快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。
消息称三星电子年底前向 Naver 交付 AI 芯片 Mach-1,交易额至高 1 万亿韩元
据韩媒 hankyung 报道,三星计划年底向韩 IT 巨头 Naver 出货 AI 芯片 Mach-1,交易额至高 1 万亿韩元(IT之家备注:当前约 54.2 亿元人民币)。近日三星电子 DS 部门负责人庆桂显宣称,Mach-1 目前处于 SoC 设计阶段,三星计划在今年底完成该 AI 芯片的制造过程。Mach-1 基于非传统结构,可将其核心计算芯片同 LPDDR 片外内存间的瓶颈降低至现有 AI 芯片的 1/8,同时能耗也只是英伟达竞品的 1/8。据以往报道,三星与 Naver 于 2022 年末展开了 AI 芯片研发合作,为 Naver 的 HyperCLOVA 大模型开发定制芯片。
工信部王正:我国人工智能核心产业规模接近5800亿元
在3月22日举行的昇思人工智能框架峰会2024上,工业和信息化部科技司科技发展处处长王正表示,今年以来,以大模型为代表的人工智能深入演进,已经进入新一轮发展加速期,我国面临难得发展机遇。截至2023年底,我国人工智能核心产业规模接近5800亿元,已经形成了京津冀、长三角、珠三角三大集聚发展区,核心企业数量超过4400家,居全球第二。
周鸿祎:2024年是AI手机元年,手机厂商不做AI会成为下个诺基亚
360公司创始人周鸿祎在一加手机发布会上表示,2024年是AI手机元年,大模型推动智能手机2.0时代的到来,不转向AI的手机厂商会成为下一个“诺基亚”。就像当初智能手机出现颠覆功能机一样,手机市场有可能被重新洗牌,中国手机厂商积极拥抱AI,有机会像新能源汽车一样,实现弯道超车。
联想刘军:AI PC 将成为每一个人的个人 AI 助理
在AMD AI PC创新峰会上,联想集团执行副总裁兼中国区总裁刘军表示,“AI PC将是AI普惠的首选终端,并成为每一个人的个人AI助理。他透露,联想AI PC战略和具备五大特征的联想AI PC新品,将于4月18日的联想创新科技大会上正式发布。
国内首部 AI 全流程微短剧《中国神话》启播
在中央广播电视总台成立6周年之际,3月22日,央视频AI微短剧启播暨AI频道正式上线,我国首部AI全流程微短剧《中国神话》与受众见面。AI全流程微短剧《中国神话》共六集,分别为《补天》《逐日》《奔月》《填海》《治水》《尝百草》,由一个个经典神话故事起笔,借助AI技术拓展人们对神话的常规想象。
图灵奖得主、“AI教父”辛顿最新采访称 AI 将操控人类
图灵奖得主杰弗里·辛顿奠定了作为目前AI核心技术的“深度学习”的基础。2023年,他突然从已工作10多年的美国谷歌辞职,开始谈论AI的威胁。被誉为“AI教父”的多伦多大学名誉教授杰弗里·辛顿接受日本经济新闻(中文版:日经中文网)采访时表示:“很多人主张,要防止AI失控,只要关掉电源开关就可以。但超越人类智慧的AI可以用语言操纵我们”,他预测:“未来10年内将出现自主杀死人类的机器人武器”
吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型
今天,人工智能著名学者、斯坦福大学教授吴恩达指出:AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。他呼吁所有从事人工智能工作的人都关注 AI 智能体工作流,并撰写一篇博客简单阐述了原因。
Suno 发布 v3 版本 AI 音乐生成模型,几秒生成两分钟歌曲
人工智能初创公司 Suno 今天正式宣布推出 v3 版本的 AI 音乐生成模型,可在几秒钟内创建完整的两分钟歌曲,现在所有用户都可以通过 Suno的官网 进行使用。v3 版本提供了更好的音频质量、更多音乐风格和流派、更好的提示一致性,包括更少的幻觉和更优雅的歌曲结尾。
白宫报告:AI或加剧收入不平,约10%工人岗位面临最大风险
根据白宫周四发布的一份最新报告,约有10%的美国工人所从事的工作,被快速发展的人工智能(AI)颠覆的风险最大。报告发现,教育程度较低和收入较低的工人尤其容易受到人工智能的影响,从而增加了该项技术可能加剧收入不平等的风险。
腾讯考虑在中东扩大云业务,瞄准该地区AI发展
3月21日消息,腾讯集团高级执行副总裁汤道生在沙特利雅得接受采访称,腾讯在中东地区的投资“仍处于起步阶段”,但势将快速增长。汤道生称:“我们将在今年宣布更多消息。我们在这个市场看到许多潜力,所以会增加投资。”汤道生透露,腾讯最初会关注向娱乐和游戏公司提供云存储。汤道生表示,“AI是这一地区的流行词”,腾讯正在该领域积极开展投资。他补充说,腾讯在中东地区的部分客户已开始使用其数据中心训练AI模型。
联合国大会通过首个有关人工智能的全球决议草案
当地时间周四(3月21日),联合国大会通过了首个有关人工智能(AI)的全球决议草案,以确保这项强大的新技术能够造福所有国家、尊重人权,并且是“安全的、可靠的和值得信赖的”。据了解,美国是这项决议草案的发起国,中国和121个国家参与了共同提案。最终,草案未经表决就以协商一致方式通过,这代表了联合国所有193各成员国对它的支持和认可。
微软推出首批配备专用 Copilot AI 按键的 Surface 个人电脑
在今天的新品发布会上,微软推出了两款商用设备:Surface Laptop 6 商用版和 Surface Pro 10 商用版。其中,Surface Pro 10 商用版针对商务用户需求进行了全面升级,带来更强劲的性能、更持久的续航、更出色的显示效果以及 5G 连接等亮点功能。此外,Surface Pro 10 商用版是微软首批在键盘上配备专用 Copilot 按键的人工智能 PC 之一(也可以选择不配备)。
2024年3月21日·周四
百度地图AI向导用户破亿,日均提供超千万次对话
3月20日,全球首个AI原生地图——百度地图宣布其“AI向导”用户规模累计破亿,日均提供超千万次对话。这是自2023年10月17日百度世界大会首发“AI向导”以来,百度地图第一次披露该业务相关数据。百度地图“AI向导”成为继文心一言之后,国内又一个宣布用户破亿的大模型产品。
英伟达 CEO 黄仁勋预测:十年内 AI 将能实时生成游戏中的所有像素
在英伟达 GTC 2024 大会上发布了全新 Blackwell GPU 架构之后,黄仁勋在问答环节中对游戏领域的 AI 未来做出了大胆预测。据 Tom’s Hardware 报道,这位 CEO 认为,仅需十年甚至更短的时间,AI 就能够实时生成游戏中的所有像素。
微软和理海大学的团队推出可生成 12 秒视频的多 AI 智能体框架 Mora
微软和理海大学的研究人员发布视频生成多AI Agents框架Mora,利用Agent还原Sora能力,实现了文本到视频生成、文本+图像到视频生成、扩展生成视频、视频到视频编辑、连接视频和模拟数字世界等功能,目前支持生成1024*576分辨率的12秒视频。
淘宝“星辰”大模型亮相,布局电商和生活服务场景
据Tech星球独家获悉,淘宝天猫集团自研大模型“淘宝星辰”官网已经上线,这也是淘天集团公开的首个自研大模型。官网除了显示该大模型的介绍外,还设置有“立即体验”和“登录/注册”入口,或将在不久对外开放。据悉,星辰大模型基于Transformer架构,采用半自研的Megatron-ama框架进行训练,从海量电商消费数据和公开数据中持续学习,提供电商和生活服务场景增强的文案生成、多轮会话、知识问答、智能决策等能力。
Stable Diffusion 核心团队被曝从 Stability AI 集体离职
最新消息,Stable Diffusion核心研究团队已集体辞职!名单包括研究团队领导、Stable Diffusion 论文一作 Robin Rombach,共同一作 Andreas Blattmann,以及另一位作者 Dominik Lorenz。尽管当事人尚未回应离职原因,但《福布斯》爆料:Stability AI正因入不敷出且融不到新资金而陷入困境。
Nature 发表 Google Research 团队论文:AI 模型可提前 7 天预测河流洪水
来自 Google Research 洪水预测团队的 Grey Nearing 及其同事开发的人工智能模型,通过利用现有的 5680 个测量仪进行训练,可预测未测量流域在 7 天预测期内的日径流。随后,他们将该人工智能模型与全球领先的短期和长期洪水预测软件——全球洪水预警系统(GloFAS)进行了对比测试。结果显示,该模型同日预测准确率与当前系统相当甚至更高。相关研究论文以 “Global prediction of extreme floods in ungauged watersheds” 为题,已发表在权威科学期刊 Nature 上。
腾讯发布 GiiNEX 游戏 AI 引擎,用 AIGC 助力游戏研发运营
3月20日,在2024全球游戏开发者大会(GDC)上,腾讯发布了自研游戏AI引擎——GiiNEX。基于生成式AI和决策AI技术,GiiNEX将为游戏全生命周期提供丰富的AI解决方案。借助大模型等生成式AI技术,GiiNEX面向AI NPC、场景制作、内容生成等场景,提供了包括2D图像、动画、3D城市、剧情、对话、关卡以及音乐等多样化的AIGC能力,帮助开发者提升高质量内容生成的效率。
马斯克旗下脑机接口公司新进展:首位受试者直播靠意念移动光标玩游戏
当地时间3月20日,特斯拉CEO埃隆·马斯克旗下脑机接口公司Neuralink披露了首位脑机芯片植入受试者的最新情况,并表示这位四肢瘫痪的男子已经能够通过意念玩游戏和在线国际象棋。视频显示,病人Noland Arbaugh能够使用电脑下国际象棋、玩游戏《文明VI》。他在直播中一边移动棋子一边说,“如果你们都能看到光标移动,没错,那就是我,这很酷吧?”
人工智能初创公司 Cohere 据悉寻求 50 亿美元估值
知情人士称,OpenAI竞争对手、人工智能初创公司Cohere正在进行融资5亿美元的谈判,估值约为50亿美元。知情人士说,随着新模型Command-R的推出,Cohere年化收入从12月份的1300万美元增长到本月的2200万美元。
上海人工智能实验室发布自动驾驶视频生成模型 GenAD
上海人工智能实验室3月20日发文宣布,近日,该实验室联合香港科技大学、德国图宾根大学、香港大学推出大规模自动驾驶视频生成模型GenAD,通过预测和模拟真实世界场景,为自动驾驶技术的研究和应用提供支撑。视频生成模型GenAD进一步拓宽了自动驾驶技术的研究路径。结合此前推出的端到端自动驾驶模型UniAD、“语言+自动驾驶”全栈数据集DriveLM,上海人工智能实验室从多个技术维度对自动驾驶技术进行探索,从而多方位提升其智能性。
百度智能云宣布发布3款轻量级大模型+2款场景大模型
百度智能云召开千帆产品发布会,发布包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内的三款轻量级大模型。相比千亿级别参数的大模型,轻量级大模型的参数量更小,更便于客户针对特定使用场景进行模型精调,更容易达成使用效果预期,同时节约更多成本开销。此外,百度智能云ModelBuilder还基于百度自身业务沉淀,推出了ERNIE Character和ERNIE Functions两款垂直场景大模型。
AI 网站生成平台 Dora AI 宣布即日起开启全面公测
3月21日,开发平台 Dora 宣布,首个生成式 AI 网站开发平台 Dora AI 结束候补内测全面开启公测。据悉,用户可以像ChatGPT那样,只使用文本就能通过 Dora AI,端到端地快速开发商务、科技、营销、动漫等几十种类型网站,页面、功能编辑支持可视化拖拽操作。
黄仁勋圆桌论坛对话 Transformer 论文七大作者
在今年的GTC大会上,英伟达的黄仁勋以一种充满仪式感的方式邀请了Transformer的七位作者(Niki Parmar因故临时未能出席)参与圆桌论坛的讨论,这是七位作者首次在公开场合集体亮相。他们在对话中也表达了一些令人印象深刻的观点:● 这个世界需要比Transformer更好的东西,我想我们在座的所有人都希望它能被某种东西所取代,将我们带到一个新的性能高原。● 我们在最初的目标上并没有成功,我们开始Transformer的初衷是想要模拟Token的演化过程。它不仅仅是线性的生成过程,而是文本或代码的逐步演化。● 像2+2这样的简单问题,它可能会使用大模型的万亿参数资源。我认为自适应计算是接下来必须出现的事情之一,我们知道在特定问题上应该花费多少计算资源。● 我认为当前的模型太过经济实惠,规模也还太小,大概1美元百万toke的价格,比外出购买一本平装书要便宜100倍。
GitHub 的最新人工智能工具可自动修复代码漏洞
GitHub 推出了代码扫描自动修复功能的首个测试版,用于在编程过程中查找和修复安全漏洞。这项新功能结合了 GitHub Copilot 的实时功能和公司的语义代码分析引擎 CodeQL。该公司于去年 11 月首次预览了这一功能。GitHub 承诺,这一新系统可以修复其发现的三分之二以上的漏洞–通常开发人员无需亲自编辑任何代码。
英特尔高宇:AI PC 提升内存容量需求,32GB 将成为入门级标配
英特尔中国区技术部总经理高宇在 2024 中国闪存市场峰会上表示,未来 AI PC 入门级标配一定是 32GB 内存,而当前 16GB 内存一定会被淘汰,明年 64GB PC 将开始出货。同时,AI PC 对 SSD 性能和容量提出非常高的要求。
2024年3月20日·周三
腾讯混元大模型参数规模扩至万亿,去年视频号总用户使用时长翻番
腾讯控股发布的2023年度业绩透露出信号:得益于视频号、AI大模型等多项业务渐露头角,代表数实经济的腾讯三大主业之一金融科技及企业服务业务实现了双位数增长。腾讯在财报中首度披露腾讯混元采用混合专家模型结构,已扩展为万亿参数规模。财报显示,目前腾讯混元大模型已具备文生图、视频生成等能力。腾讯内部超过400个业务及场景已接入腾讯混元测试。
加拿大和阿联酋游说欧洲与英国多家 AI 创企搬迁总部
据界面新闻援引金融时报消息,知情人士称,近几个月来,加拿大和阿联酋官员已接洽德国Aleph Alpha、英国Synthesia和StabilityAI等人工智能创企,寻求游说这些公司搬迁总部。据悉,游说条件包括补贴、宽松税收制度和轻监管等措施。
知乎发布全新AI发现搜索功能,周源:做AI时代可信赖的社区
“2024知乎发现大会”上,知乎公布了首届灯塔计划的创作成果,发布了“海盐计划6.0:航海家”“DEEP TRUST营销体系”“短篇故事3A计划”多项新产品和举措。值得一提的是,知乎创始人、董事长兼CEO周源带来了知乎大模型的最新进展,发布了全新AI功能“发现·AI搜索”,该功能以社区可信赖内容为来源,给用户带来集搜索、实时问答和追问功能于一体的全新体验。周源表示:“当社区成为可信赖的家园,就有机会不止于社区。”
苹果CEO库克现身上海,称苹果的生成式AI将在今年晚些时候宣布
苹果公司CEO蒂姆·库克3月20日现身上海。当界面新闻问及“iPhone在AI上有何进展时”,库克表示,AI已经运用在了苹果产品的各方面,例如Apple Watch的摔倒检测以及iPhone的预测性文本输入等功能,都是由AI来完成驱动的。这也是其首度在中国谈及AI话题。库克同时重申,“苹果的生成式AI,在今年晚些时候会有新闻宣布。”
360 发布国内首个实现 AI 实战应用安全大模型
360公司今日发布安全大模型3.0,系国内首个实现AI实战应用的安全行业大模型。360称,以大语言模型为代表的的AI技术,不仅要为安全防护提供技术支撑,同时也要推动安全领域的创新与发展。
Canalys:2024年全球AI PC出货量将达4800万台,占PC总出货量的18%
Canalys最新预测数据显示,2024 年,全球AI PC 出货量将达到 4800 万台,占个人电脑(PC) 总出货量的 18%。但这仅是市场转型的开始,预计到2025年,AI PC出货量将超过1亿台,占PC总出货量的40%。到 2028 年,AI PC出货量将达到2.05亿台,2024 年至 2028 年期间的复合年增长率(CAGR)将达到惊人的 44%。
育碧展示生成式 AI 原型项目,游戏 NPC 可自由即兴对话
育碧今日展示了其巴黎工作室最新的生成式 AI 原型项目 NEO NPC,令 NPC 实现以自发的行动和反应进行对话,而非遵循对话树中的设定。该项目应用了英伟达的 Audio2Face 与 Inworld 的 LLM 大语言模型技术。育碧表示,所有生成式 AI 项目的目标都是为玩家带来价值,开发过程始终以玩家和开发人员的创造力为重点。
融资逾 15 亿美元的 Inflection AI 表示计划将其技术授权给微软,投资者将获得补偿
人工智能初创公司 Inflection AI 表示,计划将其技术授权给微软,这是这家初创公司转向与企业客户合作的一部分,此前该公司的大部分员工都跳槽去了微软。此前报道称,微软已经聘请了 Inflection AI 首席执行官兼联合创始人 Mustafa Suleyman、首席科学家兼联合创始人 Karén Simonyan 以及这家初创公司的大部分员工。据一位知情人士透露,已融资逾15亿美元的Inflection投资者将得到补偿。该知情人士拒绝透露投资者将如何或何时获得回报。Inflection 的支持者包括微软、英伟达、比尔·盖茨和联合创始人Reid Hoffman
消息称 OpenAI 将在今年年中发布 GPT-5 大模型,或在今年夏天期间
知情人士称,OpenAI将在今年年中的某个时候发布GPT-5,很可能是在今年夏天期间。一些企业客户最近已经收到了GPT-5大模型及其对ChatGPT相关改进的演示。“它的性能非常棒,提升很大。”一位看过GPT-5大模型演示的CEO表示。该CEO表示,OpenAI使用他的公司独有的用例和数据展示了GPT-5。他说,OpenAI还提到了该模型尚未发布的其他功能,包括调用OpenAI正在开发的AI代理来自主执行任务。
诺和诺德基金会携手英伟达,拟建AI超级计算机用于新药和疗法发现
当地时间3月18日,诺和诺德基金会(诺和诺德背后的企业基金会)宣布将与英伟达合作,在丹麦建造一台名为Gefion的AI超级计算机,该计算机将运行英伟达的AI技术,主要目标是发现新的药物和治疗方法,可供丹麦公共和私营部门的研究人员使用。
李飞飞:不管技术词汇多陌生,我也恳求你在AI时代中有一个角色
在今年的GTC炉边谈话中,李飞飞(斯坦福大学教授、美国工程学院院士、AI视觉领域的顶尖专家)讲了自己的故事,一个住在美国乡镇里爱跳舞的女孩的故事——她不是计算机科学家,不是理科毕业的,甚至家里连电脑都没有,但她还是和AI产生了如此多的联系,在AI的发展中扮演了一个角色。所以我们不要被那些时髦的术语吓到,不要迷茫于AI时代自己的角色。只要把AI当成一个工具,人类不仅是工具的创造者,我们也是如何使用工具的决策者。去拥抱它,去做那个决策者,做那个让它被正确使用,变得更好的人。我们在AI时代的未来一定会像马丁路德想的那样,让人类文明的弧线朝着正义、希望、仁爱的方向发展。这就是我们每个人,每个普通人,而非硅谷精英应该在这个AI时代里的角色。这也是这位AI教母对每个人的恳求:在AI发展中有一个角色。
消息称沙特阿拉伯计划设立 400 亿美元 AI 风投基金
据《纽约时报》报道,沙特阿拉伯正计划设立 400 亿美元的 AI 初创企业风投基金。根据多位消息人士的说法,这一坐拥巨大石油财富的海湾国家正寻求支持一系列的 AI 科技初创企业,涵盖从芯片设计到数据中心领域。该国代表甚至表示沙特正考虑创办自己的 AI 公司。具体而言,沙特方面与硅谷顶级风险投资公司 Andreessen Horowitz(a16z)等方就潜在的合作关系进行了讨论,不过计划仍存有变化的可能。该基金有望于今年下半年正式推出。
黄仁勋回应中国市场和AI芯片定价问题,称英伟达市值合理
针对有媒体援引黄仁勋关于英伟达最新一代AI芯片Blackwell的定价在3万至4万美元,黄仁勋予以回应。他表示:“我只是试图让大家对我们产品的定价有一定的感受,而并不打算给出具体的报价。因为根据每一个客户的需求,不同系统的价格差异是很大的,英伟达并不销售芯片,我们售卖的是数据中心。”黄仁勋在采访中仍然强调了中国市场的重要性。他表示:“我们正在尽全力使英伟达的业务在中国能够实现最大化,我们面向中国市场推出了L20和H20芯片,这些向中国出售的芯片将符合要求。”
微软设立新的AI部门,由原谷歌 DeepMind 联合创始人领导
据国外媒体报道,美国当地时间周二,微软宣布已聘请人工智能初创公司DeepMind的联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)领导其新成立的人工智能部门,负责Copilot等项目。这一举措标志着微软在竞争激烈的人工智能产品市场上,正积极抵御来自谷歌的挑战。苏莱曼也是AI创企Inflection AI的联合创始人兼CEO,其创业伙伴西蒙尼安以及大批员工随同其加盟微软。
2024年3月19日·周二
Unity 调查:超六成游戏工作室采用 AI 进行开发
根据 Unity 的调查显示,超过六成(62%)的游戏工作室在其项目开发过程中会利用人工智能的辅助,这些工具通常被用于节省时间和提高效率。根据 68% 的受访者反馈,使用人工智能的主要原因是为了减少制作原型的时间。
奥特曼专访:关于 GPT-5、Sora、Ilya、Q*、AGI、外星人等等一切
今天凌晨,OpenAI CEO Sam Altman 公开一则专访,里面包含一切大家感兴趣的话题,其中主持人是 Lex Fridman。公众号赛博禅心精译了全文,谈话内容按顺序如下: OpenAI 董事会之争、Ilya Sutskever 去哪了?、Elon Musk 的诉讼、Sora、GPT-4、记忆与隐私、Q*、GPT-5、7 万亿美金的募资、Google and Gemini、跨越到 GPT-5、AGI、外星人。
Stability AI 开源上新:3D 生成引入视频扩散模型 SV3D
Stable Diffusion背后公司Stability AI又上新了。这次带来的是图生3D方面的新进展:基于Stable Video Diffusion的 Stable Video 3D (SV3D) ,只用一张图片就能生成高质量3D网格。Stable Video Diffusion(SVD)是Stability AI此前推出的高分辨率视频生成模型。也就是说,此番登场的SV3D首次将视频扩散模型应用到了3D生成领域。官方表示,基于此,SV3D大大提高了3D生成的质量和视图一致性。
阿里大模型产品“通义听悟”升级:超长视频自由问,还会做思维导图
今日阿里大模型产品“ 通义听悟 ”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。通义听悟本次升级上新了六大功能点,其中最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。
OpenAI GPT商店发展缓慢:多数GPT没有用户,开发者信心受损
在OpenAI推出GPT商店4个月之后,一些通过该商店提供聊天机器人的开发者表示,他们对自己的产品缺少用户感到失望。开发者还表示,在用户分析方面,他们几乎没有得到OpenAI的支持。OpenAI还限制非ChatGPT付费用户访问GPT商店,并且也不允许开发者对GPT收费。向应用开发人员(包括为GPT商店开发应用的开发人员)出售分析工具的基里尔·德莫奇金(Kirill Demochkin)说:“人们觉得OpenAI已经放弃了GPT商店。”
SK海力士开始量产下一代HBM,本月下旬起向客户供货
在今天的英伟达GTC 2024大会上,英伟达CEO黄仁勋宣布推出新一代GPU Blackwell,第一款Blackwell芯片名为GB200,将于今年晚些时候上市。作为英伟达唯一HBM3供应商,SK海力士随即发布新闻稿,宣布已开始量产高带宽内存产品HBM3E,将从3月下旬起向客户供货。七个月前,该公司公布了HBM3E开发成功的消息。
三星成立半导体AGI计算实验室,力图改进AI芯片设计
三星电子半导体业务CEO庆桂显在LinkedIn上宣布在美国和韩国成立三星半导体AGI计算实验室,目前已经开始招聘工作。AGI计算实验室将专注于开发用于大型语言模型的芯片,重点是推理和服务应用。“我们的计划是不断推出 AGI 计算实验室芯片设计的新版本,这种迭代模式将以极低的功耗和成本提供更强的性能,并支持越来越大的模型。”庆桂显写道。
美国 FTC 已就 Reddit 向 AI 公司分享用户生成内容发起非公开调查
据 Reddit 证券文件披露,美国联邦贸易委员会(FTC)正就该社交平台将内容向 AI 公司授权一事进行非公开调查。据外媒 Axios 透露,还有其他公司也收到了 FTC 的调查信函。Reddit 于上月申请 IPO,以每股 31~34 亿美元的价格募集最多 7.48 亿美元,总估值接近 65 亿美元。此前据外媒报道,Reddit 已同谷歌达成了 AI 训练数据授权协议,每年可获得 6000 万美元(当前约 4.32 亿元人民币)收入。在 Reddit 看来,FTC 关注这一新类型交易是很自然的行为;Reddit 不认为其举动违反了美国消费者保护法。
调查显示85%的中国企业将加速AI采用,比例为全球最高
IBM 委托Morning Consult调研并发布的《2023年全球 AI 采用指数》显示,中国企业的AI采用率稳居“第一阵营”,85%的中国企业表示未来会加速AI采用,这一比例为全球最高。技能不足和数据治理仍是阻碍企业落地AI 技术的主要障碍;正因如此,全球约 40% 的企业仍处于探索和试验阶段,尚未部署 AI 能力。
解决芯片编译技术“卡脖子”问题,「中科加禾」获数千万元融资
「中科加禾」近日完成数千万元天使轮融资,本轮由元禾原点领投,新尚资本、中科院创投、晨山资本、BV百度风投跟投,指数资本继续担任独家财务顾问。本轮融资资金计划用于产品研发和公司运营。中科加禾创立于2023年,致力于打造面向大模型领域的国产编译工具以及配套的软件适配及优化工具。
一文读懂英伟达GTC:黄仁勋晒最强AI芯片,人型机器人也来了
今年的GTC2024上,黄仁勋宣布新一代AI芯片B200,作为NVIDIA Blackwell架构首款新产品,B200采用双芯片设计,晶体管数量达到2080亿个,基于Blackwell架构的B200,英伟达还提供了包括GB200、DGX GB200 NVL 72,以及基于GB200和B200打造的DGX SuperPOD超算平台。软件服务方面,英伟达发布了集成AI开发软件微服务系统NIM,通过直接提供多行业、多模态的专有模型,以及基于NeMo Retriver的专有数据注入系统,企业可借由NIM快捷部署公司级专有模型。除了通过软硬件赋能AI技术之外,英伟达也推出了加速AI仿生机器人落地的解决方案——GR00T机器人项目——世界首款人形机器人模型,支持通过语言、视频和人类演示,为机器人的生成行动指令。
Adobe 将 Firefly 生成式 AI 引入 Substance 3D 设计软件
Adobe 首次将 Firefly 生成式 AI 功能集成到 Substance 3D Sampler 和 Stager 中,使工业设计师、游戏开发人员和 VFX 专业人士的 3D 工作流程更加无缝和高效,提供的文本到纹理和生成背景功能大大加速了传统上耗时且复杂的 3D 纹理和分段任务。
2024年3月18日·周一
微软 Win11 Dev / Canary 渠道测试新特性:右键菜单新增 Copilot 按钮,支持文本总结
博主 PhantomOcean 北京时间今日凌晨在 X(推特)上公布了自己的最新发现:微软 Windows 11 的 Dev 和 Canary 渠道正在测试为右键菜单引入 Copilot 按钮,用户可以通过该按钮来完成文本总结等功能。从功能方面来看,该按钮有望支持对各种各样的文档、表格或 PPT、PDF 文件进行总结,另一个子菜单则显示“发送给 Copilot”,预计为图片识别等类型功能。
AI 独角兽云知声推进港股IPO:京东、360参投,亏损累计近5亿元
“AI独角兽”云知声智能科技股份有限公司(下称“云知声”)更新招股书招股书,继续推进港交所主板上市进程,中金公司和海通国际为其联席保荐人。这已是云知声第二次冲刺上市。2020年11月,云知声曾经向上交所科创板递交过上市申请,但仅隔3个月便宣布终止。云知声已获得启明创投、挚信资本、磐谷创投、中网投、京东、中电健康基金、中金、360、高通等知名机构的投资。云知声也在2023年发布了600亿参数的山海大模型,目前的版本参数规模已迭代至千亿,计划将大模型应用在智慧生活及智慧医疗领域。
工业机器人龙头 ABB 接连收购 AI 企业将人工智能嵌入全线业务
近日,在全球工业机器人龙头ABB举办的人工智能战略发布会上,ABB机器人与离散自动化事业部总裁安世铭博士表示,ABB将人工智能嵌入全线业务,100多个AI项目正在推进中。据了解,2024年初,ABB收购了瑞士初创公司Sevensense,以扩大其在新一代人工智能自主移动机器人领域的地位。另外还收购了研发工程公司Meshmind的大部分股份,扩大了其在人工智能、工业物联网和机器视觉领域的研发能力。目前,ABB电气、运动控制、过程自动化、机器人与离散自动化四大业务均已将人工智能投入应用,服务各行业客户。
辛顿、姚期智等中外专家签署《北京AI安全国际共识》:禁止AI自行复制,不应用于生化武器
据腾讯科技报道,包括图灵奖得主约书亚·本吉奥、杰弗里·辛顿、姚期智等在内的数十位的中外专家日前在北京联合签署了由智源研究院发起的《北京AI安全国际共识》(以下简称共识),涉及人工智能“风险红线”和“路线”两大块,其中“风险红线包含自主复制、改进”,“权力寻求”、“协助不良行为者”和“欺骗”四个部分。
MIT 最新研究:大模型的能力大约每8个月就会翻一倍,增速远超摩尔定律
近日,来自MIT FutureTech的研究人员发表了一项关于大模型能力增长速度的研究,结果表明:LLM的能力大约每8个月就会翻一倍,速度远超摩尔定律。LLM的能力提升大部分来自于算力,而摩尔定律代表着硬件算力的发展,——也就是说,随着时间的推移,终有一天我们将无法满足LLM所需要的算力。
OpenAI CEO 奥特曼称 GPT-5 的能力提升幅度将超乎人们的想象
在旧金山 1960 大厦举行的 K-Startup-OpenAI Match Day 上奥特曼接受了韩国硅谷特派记者团的采访,他表示:“许多创业公司认为GPT-5只是略有进步而非大幅提升,这将为他们提供更多的商业机会。但这是一个错误的假设,如果按照这种思路,这些公司可能会被新一代模型完全“碾压”,甚至摧毁。因为GPT-5的能力提升幅度将超乎人们的想象…”、“我不知道GPT-5将何时发布,但它将在高级推理功能上实现质的飞跃,这不仅仅是一次小步进,而是一次巨大的跨越。”他还反驳了外界对GPT模型存在局限的猜疑,表示如果能投入足够的计算资源,构建超越人类智能的通用人工智能(AGI)将指日可待。他甚至指出,对于自己和OpenAI而言,除了追求AGI的构建之外,几乎不再关注其他任何事情,即使是曾经受到广泛关注的区块链和生物技术等领域。
马斯克旗下 xAI 开源 Grok-1:3140 亿参数,权重架构全开放
今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「 Grok-1 」,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。Grok-1 的模型细节包括如下:基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调;3140 亿参数的 MoE 模型,在给定 token 上的激活权重为 25%;2023 年 10 月,xAI 使用 JAX 库和 Rust 语言组成的自定义训练堆栈从头开始训练。xAI 遵守 Apache 2.0 许可证来开源 Grok-1 的权重和架构。
高通推出第三代骁龙8s移动平台,支持终端侧生成式AI功能
高通技术公司今日宣布推出第三代骁龙8s移动平台。据悉该平台将会搭载终端侧生成式AI功能,支持Baichuan-7B、Gemini Nano、Llama 2和智谱ChatGLM等大语言模型。荣耀、iQOO、真我realme、Redmi和小米等厂商都将采用第三代骁龙8s平台,首款终端预计将于3月面市。
苹果公司据悉洽谈将谷歌的 Gemini 嵌入 iPhone
知情人士称,苹果公司正在洽谈将谷歌的Gemini人工智能引擎植入iPhone。这两家公司正在积极谈判,以便让苹果授权谷歌的生成式人工智能模型Gemini,为今年iPhone软件的一些新功能提供动力。知情人士还称,苹果最近还与OpenAI进行了讨论,并考虑使用其模型。
Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型「Open-Sora 1.0」
继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后,Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型 「 Open-Sora 1.0」,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重,携手全球 AI 热爱者共同推进视频创作的新纪元。
月之暗面 Kimi 智能助手宣布支持 200 万字无损上下文
通用人工智能创业公司“月之暗面”(Moonshot AI)宣布在大模型长上下文窗口技术上取得新的突破, Kimi Chat 智能助手已支持200万字超长无损上下文,并于即日起开启产品“内测”。
消息称英伟达洽购以色列人工智能初创公司Run:AI
据知情人士称,英伟达正在就收购以色列人工智能基础设施编排和管理平台Run:AI进行深入谈判。这笔交易的价值估计在数亿美元,甚至可能达到10亿美元。Run:AI于2018年创立,该公司开发了一个编排和虚拟化软件层,专门针对运行在GPU和类似芯片组上的AI工作负载的独特需求。如果交易完成,这将是英伟达自2019年3月以69亿美元收购Mellanox以来在以色列的首次收购。
消息称英伟达 Blackwell“B100”GPU 将配 192GB HBM3e 显存,B200 配 288GB 显存
英伟达将在明日举行 GTC 2024 主题演讲,黄仁勋预计将宣布名为 Blackwell 的下一代 GPU 架构。据 XpeaGPU 爆料称,明天推出的 B100 GPU 将采用两个基于台积电 CoWoS-L 封装技术的芯片。CoWoS(晶圆基片芯片)是一项先进的 2.5D 封装技术,涉及将芯片堆叠在一起,提高处理能力,同时节省空间并降低功耗。XpeaGPU 透露,B100 GPU 的两个计算芯片将连接到 8 个 8-Hi HBM3e 显存堆栈,总容量为 192GB。值得注意的是,AMD 已经提供了 192GB 的相同容量,并在其 Instinct MI300 GPU 上搭载了 8 个 HBM3 芯片。爆料人称代号为 B200 的下一代 Blackwell GPU 更新将利用 12-Hi 来实现更高的容量,显存达到了 288GB,但没有透露是 HBM3e 还是 HBM4。
2024年3月17日·周日
谷歌推出 Cappy “打分”框架,可评估 AI 准确性“教模型更聪明”
据谷歌官方新闻稿,谷歌近日推出了一项名为 Cappy 的模型打分框架,该框架以 RoBERTa 语言模型为基础,主要用于检测模型输出的内容,并为相关内容打分,之后相关分数将会作为参考基准让模型学习,从而让模型更聪明。此外,Cappy 框架也可以作为大语言模型的“候选机制”,该框架可以内置在模型中,并对模型预输出的内容生成分数,并选择分数最高的回应作为最终输出,以提高大语言模型输出内容的正确性。
微软推出 AI 自主编程框架 AutoDev,可自主规划和执行复杂的软件工程
在 Cognition 发布 Devin 的同一天,微软的研究团队也发布了一个 AI 自主编程框架 AutoDev ,专为自主规划、执行复杂的软件工程任务而设计,还能维护Docker环境中的隐私和安全。用户可以定义复杂的软件工程目标,AutoDev会将这些目标分配给自主AI智能体来实现。然后,这些AI智能体可以对代码库执行各种操作,包括文件编辑、检索、构建过程、执行、测试和git操作。甚至,它们还能访问文件、编译器输出、构建和测试日志、静态分析工具等。
南加州大学最新研究:ChatGPT 参数规模或只有 70 亿
南加大团队三位作者破解出了未公布的gpt-3.5-turbo嵌入向量维度(embedding size)为4096或4608。而几乎所有已知的开源大模型如Llama和Mistral,嵌入向量维度4096的时候都是约7B参数规模。其它比例的话,就会造成网络过宽或过窄,已被证明对模型性能不利。因此南加大团队指出,可以推测gpt-3.5-turbo的参数规模也在7B左右,除非是MoE架构可能不同。
2024年3月16日·周六
2024 谷歌 I/O 开发者大会 5 月 14 日举行,将聚焦 AI 及带来 Android 15 新消息
谷歌日前发布公告,宣布将于 5 月 14 日举办 2024 年度 I / O 开发者大会。本次大会主要通过在线直播方式进行,不过会邀请少量开发者、嘉宾、自媒体到现场观看。本次开发者大会的主题,其中一个必然是人工智能(AI),谷歌在官方博文中提及“Gemini 时代”,预估会发布大量关于 Gemini 模型的最新动态。谷歌可能会在本次发布会上公布关于安卓 15 系统的相关信息。硬件方面,谷歌可能会在本次开发者活动中宣布 Pixel 8a 手机,更新 Chromecast 和 Google TV 产品等等。
小鹏汽车CEO何小鹏:未来18个月内高阶智驾的拐点将到来
3月16日,在2024中国电动汽车百人会论坛上,多家国内汽车公司负责人出席,探讨汽车产业变革趋势和破解行业发展瓶颈的新路径。随着新能源汽车智能化下半场竞争的展开,头部汽车企业均在加码智能驾驶领域的资源投入。小鹏汽车CEO何小鹏认为,未来18个月内,高阶智驾的拐点将会到来,并做到全场景、更聪明和更经济。
美图创始人吴欣鸿:Sora 给行业较大心理冲击,原本以为 2-3 年后才能实现
美图公司昨日披露 2023 年业绩报告,全年实现总收入 27 亿元,同比增长 29.3%。经调整后归属于母公司权益持有人净利润 3.7 亿元,同比增长 233.2%。美图公司创始人、董事长兼首席执行官吴欣鸿在业绩会上表示,AI 原生工作流会是未来非常巨大的机会,美图会致力于 AI 原生应用的进一步打造。同时他还强调,美图不会做通用大模型,但美图会针对不同垂直场景的需求做模型的训练和微调。吴欣鸿透露,Sora 给了行业较大的心理冲击,原本以为这样的能力会在 2-3 年后才能实现。
奔驰汽车工厂试点 Apollo 机器人:从事搬运、装配等繁重体力活
德国车企梅赛德斯-奔驰(Mercedes-Benz)宣布和通用仿人机器人开发商 Apptronik 宣布达成协议,双方将合作探索高科技机器人 Apollo,主要从事搬运、装配零部件等繁重的低技能劳动。根据双方协议,奔驰将启动试点项目,在汽车制造过程中,测试 Apptronik 公司的 Apollo 仿人机器人执行各种任务的能力,例如向生产线运送组装套件、检查零部件等等。
自动驾驶初创公司 Waabi 推出 Copilot4D 模型,可预测车辆周围的交通流量
自动驾驶初创公司 Waabi 今天宣布,正在使用生成式人工智能模型来帮助预测车辆的移动。该新系统名为 Copilot4D,根据激光雷达传感器的大量数据进行训练。若用户向模型提示某种情况,例如驾驶员鲁莽地高速驶入高速公路,它会预测周围车辆将如何移动,然后生成未来 5 到 10 秒的激光雷达表示(可能显示连环相撞)。
2024年3月15日·周五
阿联酋 AI 投资公司 MGX 商讨投资 OpenAI 的芯片厂
市场传出消息称,本周刚刚成立的阿联酋人工智能投资公司MGX,正在与OpenAI就投资芯片业务展开初步讨论。这件事情也从侧面印证,奥尔特曼是真的想自己搞芯片厂。过去几个月里,在各大媒体口耳相传的加持下,OpenAI芯片厂的投资规模从“数百亿美元”到“7万亿美元”都有。这次与奥尔特曼的芯片厂搭上关系的阿联酋人工智能投资公司MGX,本周才刚刚成立。阿联酋人工智能和先进技术委员会(AIATC)在3月11日宣布,设立技术投资公司MGX,主要布局半导体、人工智能基础设施,以及人工智能核心技术和应用三个领域,主权财富基金穆巴达拉与阿布扎比AI企业G42在该基金创建中担任基础合作伙伴。
国家发改委:加快设在新区的国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设
国家发展改革委发布促进国家级新区高质量建设行动计划。支持新区优化重点产业布局。有序推进智能制造和数字化转型。加快设在新区的国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设,上海浦东新区带动赋能千家企业数字化转型,天津滨海新区打造一批典型应用场景。研究支持在有条件的新区所在地方布局建设未来产业先导区。依托设在新区的中小企业数字化转型试点和新区承担的建设国家算力枢纽节点等重要任务,实施智能制造重大项目,布局一批工业互联网平台。
腾讯联合清华大学、香港科技大学推出图生视频模型“Follow-Your-Click”,可点击生成局部动画
腾讯和清华大学、香港科技大学联合推出全新图生视频模型“ Follow-Your-Click ”,基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。据了解,腾讯混元大模型团队,正在持续探索多模态技术。
海尔联合乐聚展出人形机器人“夸父”:支持洗衣、浇花等操作,搭载开源鸿蒙
3 月 14 日至 16 日,海尔机器人、乐聚机器人在 2024 年中国家电及消费电子博览会(简称:AWE)联合展出了国内首款面向家庭场景的人形机器人 ——Kuavo(夸父)。Kuavo(夸父)作为国内首款可跳跃、可适应多地形行走的开源鸿蒙人形机器人,在 AWE 展会现场除了展示其跳跃、快走等控制性能,还展示了洗衣、浇花、插花、晾衣服等近期学习的手部操作成果。
苹果的研究团队发布 MoE 架构的 300 亿参数多模态大模型 MM1
今日,在一篇由多位作者署名的论文 《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》 中,苹果正式公布自家的多模态大模型研究成果 —— 一个参数最高可达 300 亿(其他为 30 亿、70 亿)的多模态模型系列,由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现 SOTA,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。
海信发布电视行业自研星海大模型,并推出旗舰新品
“海信视像 AI美好生活”全场景显示新品发布会上,海信正式发布了自研星海大模型,称是目前电视行业最强中文大模型。在AI的加持下,海信推出全新ULED X全场景AI计算画质平台和多款旗舰新品。
专注军民融合智能光电产品,「卓宇智能」获近亿元A轮融资
南京卓宇智能科技有限公司(以下简称「卓宇智能」)近日完成近亿元A轮融资,由金雨茂物领投,常州拓扑投资跟投。本轮融资将用于渠道和交付能力的扩建。「卓宇智能」专注于军民融合智能视觉领域,致力于为客户提供完整的机器视觉解决方案,目前产品已广泛应用于武器智能化光电系统、电力、智能制造等行业。
微软在全球推广 Copilot Pro,通过移动端注册可免费试用 1 个月
微软在一篇博客文章中宣布,Copilot Pro 现已在全球 227 个国家正式推出。微软还宣布将为 Copilot Pro (每月 20 美元)提供为期一个月的免费试用。稍有不足的是,用户必须通过安装和使用 iOS 和 Android 上的 Copilot 移动应用程序来注册试用。微软还允许 Copilot Pro 用户在其 Microsoft 365 网络应用程序中访问生成式人工智能助手。与桌面应用程序不同的是,访问网络应用程序的 Copilot 无需订阅任何 Microsoft 365 计划。(注:暂未向国内直接开放)
华尔街加速拥抱AI,摩根士丹利任命首位AI主管
据CNBC报道,摩根士丹利近期对其财富管理部门的技术负责人Jeff McMillan进行了晋升,任命他为集团首位AI主管,大摩联合总裁Andy Saperstein和Dan Simkowitz在周四发出的备忘录中确认了这一人事任命。在过去一年中,摩根士丹利利用OpenAI的GPT-4技术,为其员工打造了前所未有的解决方案,该项目正是由McMillan亲自监管。这一举措,标志着人工智能在金融服务领域中的重要性日益增强,特别是在生成式人工智能技术迅速崛起的背景下。
苹果收购加拿大人工智能初创公司 DarwinAI,将其并入 AI 部门
据外媒报道,苹果公司收购了加拿大人工智能初创公司DarwinAI,为其2024年大举进军生成式人工智能领域增添了技术实力。据知情人士透露,苹果今年早些时候收购了DarwinAI,数十名DarwinAI员工加入了苹果的人工智能部门。DarwinAI开发了人工智能技术,可以在制造过程中对部件进行视觉检测,并为一系列行业的客户提供服务。但它的核心技术之一是制造人工智能系统体积更小、速度更快。这项工作可能对苹果有所帮助,因为苹果专注于在设备上运行人工智能,而不是完全在云端运行。
谷歌的生成式 AI 搜索或导致出版行业每年广告收入损失 20 亿美元
谷歌于去年 5 月推出了人工智能驱动的搜索引擎“搜索生成体验”(Search Generative Experience),该引擎处于测试阶段,媒体高管和搜索人员表示,这可能会导致出版商的自然搜索流量下降 20% 至 60%。Raptive 创新执行副总裁 Marc McCollum 估计,在当前的 SGE 下,整个出版行业的广告收入损失每年可能高达 20 亿美元。
2024年3月14日·周四
阿里通义千问推出AI阅读助手功能:可一键速读百份文档,解析超万页长文档
阿里 通义千问 推出免费的文档解析功能,可解析网页、文档、论文、图书,突破当前大模型长文档处理的天花板。针对单个文档,通义千问能够处理超万页的极长资料,换算成中文篇幅约1000万字。针对多个文档,可一键速读100份不同格式的资料,还可解析在线网页。文档解析功能将为考试复习、文献阅读等人群提供极强辅助,现已在通义千问官网和APP同步上线。
微软 CEO 表示谷歌拥有的资源优势本应使其在人工智能竞赛中领先
微软首席执行官萨蒂亚·纳德拉(Satya Nadella)近日表示,鉴于谷歌的资源优势,它原本有条件成为人工智能竞赛的领跑者。在挪威央行投资管理公司播客“In Good Company”中,纳德拉分享了对科技巨头在人工智能竞争中的看法。纳德拉认为:“谷歌是一家极具能力的公司,他们不仅拥有顶尖人才和强大的计算资源,还具备从数据处理到芯片开发,再到模型建立和产品推广的垂直整合能力。”它理应在人工智能领域取得领先。
阿里巴巴2024全球数学竞赛启动,总奖金超400万元,首次向AI开放
据达摩院官微消息,3月14日,2024阿里巴巴全球数学竞赛开启报名。今年赛事最大的革新在于首次向AI开放,诚邀全球AI大模型挑战竞赛难度试题,准备用一场双向奔赴来激发人类与AI的数学潜力。本届大赛,初赛时间为4月13日-14日,参赛的AI模型将与人类选手一同在线上应对初赛试题的挑战。组委会将重点评估AI模型对题目的理解、逻辑推理准确性和问题解决能力。为了确保公平竞赛,避免人类替考的情况出现,参赛者需要在开赛前提交模型代码,供校验复现。最终得分排名前三的AI团队将依次获得奖金10000美元、5000美元、2000美元。
软银据悉探索投资法国人工智能初创公司 Mistral AI
知情人士称,软银集团正在探索对Mistral AI公司的潜在投资。软银已表示有兴趣在Mistral下一次融资时为其提供支持。知情人士称,任何交易都有可能使Mistral的估值超过20亿美元,不过双方还没有讨论过确切的条款。知情人士表示,双方的商议仍在进行中,目前还不能确定是否会达成协议。
智谱AI完成新一轮融资,北京市人工智能产业投资基金参与投资
据悉,智谱AI 2024 年初已完成新一轮融资,北京市人工智能产业投资基金参与投资。智谱AI也向腾讯科技表示,本次不方便透露具体的投资金额,但智谱 AI 是该基金成立以来投资的第一家人工智能大模型公司。 智谱AI由清华大学计算机系的技术成果转化而来,源自成立于1996年的清华大学知识工程实验室,拥有逾27年的人工智能技术积累。
NVIDIA(英伟达)将推出生成式 AI 专业认证
NVIDIA 即将推出一项新的生成式 AI 专业认证,助力开发者在这一重要领域证明自身技术实力。NVIDIA 深度学习培训中心(DLI)率先推出的这项全新专业认证能够使开发者、职场人士和其他相关人员证明和展示自己在生成式 AI 方面的技能和专业实力。目前新推出的专业认证计划包含两项入门级(associate-level)生成式 AI 认证,这两项认证专注于考察对大语言模型和多模态工作流技能的掌握程度。
英特尔公布 AI 战略路线图:今年推 Gaudi 3、明年推 Falcon Shores 等
英特尔近日发布公告,分享了关于 AI 战略和加速器的更多信息,在更多产品和软件中整合 AI 元素,更好服务企业和数据中心未来发展。主要内容包括:加速AI布局、Gaudi 2 性价比更高、Gaudi 3 计划 2024 年第 3 季度上市、Falcon Shores 计划 2025 年上市、3-5 行代码就能实现模型迁移、将推出中国特供版 Gaudi 硬件。
国产 GPU 厂商景嘉微宣布成功研发“景宏系列”AI 算力产品
国内 GPU 厂商长沙景嘉微电子股份有限公司(简称“景嘉微”)于 2024 年 3 月 12 日发布公告,其面向 AI 训练、AI 推理、科学计算等应用领域的景宏系列高性能智算模块及整机产品(简称“景宏系列”)研发成功,并将尽快面向市场推广。景嘉微发布的公告显示,景宏系列是面向 AI 训练、AI 推理、科学计算等应用领域的高性能智算模块及整机产品,支持 INT8、FP16、FP32、FP64 等混合精度运算,支持全新的多卡互联技术进行算力扩展,适配国内外主流 CPU、操作系统及服务器厂商,能够支持当前主流的计算生态、深度学习框架和算法模型库,号称大幅缩短用户适配验证周期。
零一万物 API 开放平台正式上线,首批提供三个模型,支持处理高达 30 万汉字
由李开复创办的国内的大模型独角兽公司零一万物,在今天正式发布了 Yi 大模型 API 开放平台。零一万物 API 开放平台链接: https://platform.lingyiwanwu.com/ 。此次 API 开放平台提供以下模型:1. Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能。2. Yi-34B-Chat-200K:200K 上下文,多文档阅读理解、超长知识库构建小能手。3. Yi-VL-Plus: 多模态模型,支持文本、视觉多模态输入,中文图表体验超过 GPT-4V。
亚马逊推出新的生成式 AI 功能将允许卖家粘贴外部链接制作产品页面
亚马逊上的卖家很快就能通过复制粘贴链接来制作产品页面。亚马逊发布了一项新的人工智能生成功能,该功能可以从卖家的外部网站获取信息,然后为该商品生成一个亚马逊产品页面,并附上文字说明和图片。亚马逊提醒卖家,如果他们选择粘贴URL来创建产品页面,他们必须是链接内容的所有者、权利持有人或拥有使用许可。否则,亚马逊表示,如果发现卖家虚报网站所有权,可能会采取法律行动。该功能现已推出,美国卖家将在未来几周内使用。
搭载 OpenAI 大模型,Figure AI 发布 Figure 01 人形机器人演示视频
初创公司 Figure AI 今天发布一段新视频,展示了人形机器人 Figure 01 所具备的技能,网友在视频中留言:“未来 5-10 年绝对是一个疯狂的时代”。Figure 01 身高 167.64 厘米(5 英尺 6 英寸),重 59.8 千克(132 磅),最多可负重 20 千克(44 磅),移动速度为每秒 1.2 米(约每小时 2.7 英里)。Figure 01 最大的亮点在于利用 OpenAI 的大型语言模型,可以和人类进行正常的完整对话。由于 OpenAI 模型还支持多模态输入,因此可为 Figure 01 提供高级视觉和语言智能。Figure 神经网络可提供快速、低级、灵巧的机器人动作。
OpenAI 首席技术官:文生视频工具 Sora 今年内将公开发布,拟支持生成音频
《华尔街日报》当地时间 13 日刊登了对 OpenAI 首席技术官米拉・穆拉蒂的采访。她表示,Sora 将在今年推出,“可能要等几个月”。穆拉蒂表示,除了面向公众公开提供 Sora 外,OpenAI 还计划加入音频生成功能,可能会使场景更为逼真。此外,公司还计划允许用户自己编辑 Sora 生成的内容,“因为 AI 工具并不总能生成准确的结果”。她说,公司正在试图找寻方法,使用户可以自行编辑、创作影音内容。
2024年3月13日·周三
欧洲议会通过《人工智能法案》:禁止人工智能操纵人类行为、利用人类弱点
欧洲议会今日以 523 票赞成、46 票反对、49 票弃权的压倒性多数支持通过了《人工智能法案》,据悉,这项法案将会“具有里程碑意义”。欧洲议会表示,该法案旨在保护基本权利、环境可持续性等方面免受“高风险人工智能”的影响,同时促进创新,以将欧洲“打造成为该领域的领导者”。
马斯克预测:明年人工智能将比任何人都聪明,2029年将超过整个人类
马斯克在X社交媒体上再发表“疯狂”预测,他写道:“明年人工智能可能会比任何人类个体都聪明,到2029年,人工智能可能比所有人类加起来还要聪明。”马斯克的这段评论发表在未来学家Ray Kurzweil的一个视频节目后。Kurzweil预测,人工智能将在2029年“实现人类水平的智能”。他说道:“我们还没有完全做到这一点,但我们一定会实现。我预测到2029年,人工智能将与任何人类能力相匹配。但我这种预测实际上仍然被认为是保守的,人们认为这种情况在明年或后年就可能发生。”
美媒:美国务院委托撰写的报告警告,AI可能对人类构成“灭绝级”威胁
根据美国有线电视新闻网(CNN)当地时间12日报道,美国国务院委托撰写的一份报告于本周发布,报告中警告,AI可能对人类构成“灭绝级”威胁,美国必须进行干预。据CNN介绍,这份报告由专注于AI领域的公司Gladstone AI撰写,该公司为美国政府高层提供关于AI机遇和风险的咨询和报告。美国国务院一名官员向CNN证实,其所在机构委托撰写了这份报告,但报告不代表美国政府的观点。
李强在北京调研:人工智能是发展新质生产力的重要引擎
中共中央政治局常委、国务院总理李强3月13日在北京调研。他强调,要深入学习贯彻习近平总书记在全国两会期间的重要讲话精神,认真落实两会明确的各项任务,牢牢把握新一轮科技革命和产业变革趋势,在推进科技创新和产业创新深度融合中培育和壮大新质生产力,加快塑造高质量发展新动能新优势。李强强调,要发挥我国应用场景丰富的优势,开放更多应用场景,加大制度供给,为人工智能产业发展营造更加宽松的环境。李强指出,人工智能是发展新质生产力的重要引擎。
微软员工抱怨公司已沦为 OpenAI 的 IT 部门
微软与OpenAI的合作不仅引发了监管部门的关注,微软的一些内部人士也开始担忧,公司的AI战略过于专注于与OpenAI的合作伙伴关系。一些员工甚至抱怨说,微软已经沦为OpenAI的一个IT部门。这些员工主要来自微软的AI平台团队,由Eric Boyd领导。该团队进行了多项内部的AI研究,但如今,越来越倾向于与OpenAI合作。这引发了一些抱怨,并导致一些曾参与微软自主研发的AI项目的高管离职。内部人士还表示,微软对之前组成Azure AI服务的内部服务的关注越来越少,而更多地关注Azure OpenAI服务。
国内团队发布“视频生音频”通用工具 Sora Opera,将在本月内上线并开放
今年3月初,娱乐资本论·视智未来得知国内有团队已经有了Pika“同款”的视频配音生成工具,并且在内部试用了小半年,用于给文生视频的静音画面添加音效或背景音乐。当时,这个应用尚未对外发布。如今,该技术背后的团队“天图万境”已准备好对外亮相。由他们开发,并与华为云合作部署的这款名为 Sora Opera 的小工具,将在3月内上线并向公众开放。
荣耀称在 AI 上已持续投入 100 亿研发费用,完成 2000+ AI 专利
在今天下午的荣耀笔记本AI PC技术沟通会上,荣耀表示,目前在AI上已持续投入100亿研发费用,完成2000+AI专利。官方表示,荣耀积极拥抱AI浪潮,坚持长期AI投资,目前的AI研发费用已达100亿元,完成相关AI专利成果2100篇,实现600类AI意图识别。即将在3月18日发布的荣耀MagicBook Pro 16笔记本,也将通过荣耀AI的全方位使能,开启AI PC新的时代。
Databricks CEO:明年英伟达 GPU 芯片价格将会大幅下降
英伟达CEO黄仁勋近期表示,最近几个季度面临供应限制的问题正在“改善”。但他也提到,2024年甚至到2025年,GPU依然会“供不应求”。不过,估值 430 亿美元的美国 AI 软件公司Databricks 联合创始人兼CEO阿里·戈德西 (Ali Ghodsi) 近期直言,随着明年供需再平衡,英伟达 GPU 芯片价格将会大幅下降(暴跌),从而给众多 AI 科技巨头和初创公司的商业模式带来影响。
GPT-4.5 Turbo 疑似提前泄露,最早或本周四上线
今天,网友纷纷发现,一款号称是GPT-4.5 Turbo的模型,竟然同时出现在了Bing、谷歌、DuckDuck Go的搜索结果里。介绍信息显示:GPT-4.5 Turbo是OpenAI到目前为止推出的速度最快、准确度最高、可扩展性最强的模型。GPT-4.5 Turbo的上下文窗口将高达256K——也就是GPT-4-Turbo的两倍,相当于约200,000个单词。根据网友的推测,GPT-4.5 Turbo的官方发布会很可能选在本周四,也就是恰逢GPT-4发布一周年的时候。作为佐证的是,Sam Altman最近即将参加Lex Fridman的播客节目。而在去年,Altman便是在GPT-4发布之后去了Fridman的播客。此外,预告信息还透露,GPT-4.5 Turbo的「知识更新截止日期」将会是2024年6月,也就是说新模型很可能原定于6月发布。显然,从泄露的消息来看,这一时间已经被大大提前。
谷歌将限制 Gemini 回答有关今年全球范围内大选的问题
谷歌周二表示,将限制人工智能聊天机器人Gemini回答有关今年全球范围内大选的问题,以避免可能出现的失误。据不完全统计,2024年全球范围内将有70多个国家和地区举行选举,覆盖了世界近一半人口、近50%的经济总量。
Meta 揭示了两个新的 24k GPU 集群的详细信息并将用于训练 Llama3
Meta 在一篇 Building Meta’s GenAI Infrastructure 的博文 中分享了构成其两个新的 24k GPU 数据中心规模集群的硬件、网络、存储、设计、性能和软件的详细信息,该公司正在使用这些集群来训练其 Llama 3 大语言模型。新的训练集群基于 Meta 的 AI Research SuperCluster (RSC),该集群于 2022 年推出。新发布的集群旨在支持自然语言处理、语音识别和图像生成等领域的人工智能研究和开发,均包含 24,576 个 Nvidia Tensor Core H100 GPU。与包含 16,000 个 Nvidia A100 GPU 的原始集群相比,这是一个明显的增长。Meta 表示,这一增长使得集群能够支持比 RSC 更大、更复杂的模型,为生成式 AI 产品开发的进步铺平了道路。
法国人工智能初创公司 Mistral AI 承诺将继续保持开源
法国初创公司 Mistral AI 是人工智能领域的后起之秀,该公司周二承诺将继续维持开源代码,尽管该公司与微软成立了一家涉及销售其部分软件的合资企业。这一消息发布之际,美国亿万富翁埃隆·马斯克起诉了 ChatGPT 的创建者 OpenAI(该公司也与微软有联系),指责该公司违反了其最初的非营利使命,即向所有人提供人工智能研究。马斯克周一表示,他将开源自己的聊天机器人 Grok。在微软在巴黎组织的一次活动中,Mistral AI 公共事务主管 Audrey Herblin-Stoop 表示,开源对于围绕人工智能建立欧洲生态系统以追赶美国公司至关重要。
2024年3月12日·周二
宁德核电推出参数量达 720 亿的核工业大模型「锦书」
中国广核集团福建宁德核电有限公司(以下简称“宁德核电”)日前发布了 自主训练的大模型「锦书」,这是专为核工业领域打造的大语言模型,其参数规模达到 720 亿。据了解,「锦书」在内部被称为“全民 GPT”项目,自 2023 年 5 月发起,旨在探索利用 AI 大模型解决核电行业面临的各种挑战,如知识管理不足、低脑力劳动过多、安全分析能力有待增强等。
Midjourney 更新推出保持角色一致性的功能 Character Reference
Midjourney 更新推出名为角色参照(Character Reference)新功能,和之前的风格参照类似,不过这次不是保持风格一致,而是保持生成图像的角色与给定的参照角色一致,将不同的风格(如动漫、写真、插画)应用到角色中。角色参照新功能适用于 Midjourney V6、Niji6 型号。
地平线计划今年香港IPO,或筹资约5亿美元推动智能驾驶发展
中国智能驾驶计算方案提供商地平线已选好投行,安排今年在香港首次公开招股(IPO),或筹资约5亿美元(约39亿港元)。知情人士表示,这家英特尔支持的公司正在与中信建投国际、高盛和摩根士丹利研究IPO事宜。该公司可能在未来数周内提交初步招股说明书。他还表示,相关讨论尚处于初步阶段,包括规模和时间表在内的IPO细节仍可能有变。
「易控智驾」获超3亿元C++轮融资,2024年无人矿卡运营数量将达1000台
近日,国内矿山无人驾驶公司易控智驾获得3亿元C++轮融资,本轮由老股东兴杭国投和紫金矿业领投,郑州人才基金跟投。叠加此前完成的C轮及C+轮融资,易控智驾在半年内合计完成7亿元股权融资。据悉,本轮融资将用于技术产品研发和无人驾驶运营管理。易控智驾创立于2018年,致力于为矿区提供无人驾驶技术与运输运营服务。
AI 语音和声纹识别初创公司「声扬科技」完成新一轮融资
深圳市声扬科技有限公司(以下简称“声扬科技”)完成由青岛某地方国资平台出资及部分老股东跟投的新一轮融资,本轮融资将主要用于以安防为核心的传统业务市场拓展,以及大模型应用生态所催生的终端语音产品矩阵的研发布局。声扬科技是专注研发全栈智能语音产品和解决方案的深圳市专精特新中小企业,以音频处理和语音分析为核心,自主研发围绕安全风控、政企服务、智能座舱等场景的创新产品与服务。
AI驱动云业务收入大涨,甲骨文财报超预期,盘后涨超13%
在AI快速发展的推动下,市场对甲骨文云计算服务需求猛增,甲骨文称很快将与英伟达发布激动人心的联合声明,预计2025财年用于数据中心建设的资本支出将达到100亿美元,盘后大涨超13%。3月12日美股盘后,云基础设施巨头甲骨文公布2024财年第三财季业绩,Q3营收为133亿美元,同比增长7.1%,符合预期;调整后EPS为1.41美元,高于市场预期的1.38美元。其中,备受关注的云计算营收猛增25%至51亿美元,超出预期,算力和存储出租业务营收为18亿美元,应用程序营收达到33亿美元。
消息称苹果正测试基于 AI 的 App Store 广告投放
两位知情人士向 Business Insider 透露:苹果正借鉴谷歌和 Meta 的做法,尝试利用 AI 进行广告推广,从而在 App Store 广告投放方面提供更优的服务。知情人士称,苹果已经开始向一小部分广告客户测试一款产品,该产品可以自动决定广告在 App Store 中的位置。苹果目前提供的广告产品已经覆盖了“搜索标签”和“搜索结果”页面,还有“您可能也会喜欢”页面,以及用户打开 App Store 时会出现在“今日”页面中的广告。在这种模式下,广告客户只需为苹果提供他们的预算、每次获取用户的成本目标以及他们想要覆盖的受众和国家 / 地区,苹果即可通过算法来自动决定如何将广告投放到上述四个可用页面中的最佳位置。
OpenAI首次司法回应马斯克起诉:指控令人费解,不排除其借机窃取技术
据国外媒体报道,在最新公布的法庭文件中,人工智能初创公司OpenAI针对埃隆·马斯克(Elon Musk)的指控进行了反驳,直言后者所提出的指控“建立在令人费解的、经常不连贯的事实前提之上”。OpenAI本次提交的这份法庭文件,是对马斯克的首次法律回应。OpenAI在文件中强调,该公司并未违反任何创始协议,因为“正如诉讼本身所表明的那样,并不存在任何创始协议,我们也未与马斯克达成任何形式的协议”。该文件还指出,一旦此案进入调查阶段,马斯克可能会利用这起诉讼获取OpenAI的“专有记录和技术”。OpenAI对此发出警告,要求对调查过程进行“谨慎监管”。
Covariant 推出 RFM-1 机器人基础模型,可赋予机器人类似人类的推理能力
仓库机器人初创公司 Covariant(注:国内分公司为深圳灵变科技有限公司)发布了 RFM-1:一个机器人基础模型,为机器人提供类似人类的推理能力,代表生成式人工智能首次成功地让商业机器人对语言和物理世界有了更深入的理解。凭借对语言和物理世界的深刻理解,RFM-1 为机器人提供了复杂的即时推理和决策能力。RFM-1 的具体功能包括:物理世界模型、语言引导编程、从自我反思中学习。
2024年3月11日·周一
三星泄露微软 Copilot 新功能:用自然语言操控各种功能
微软计划本月晚些时候发布新款 Surface 电脑和适用于 Windows 11 的 Copilot 新功能,但三星似乎等不及了,在其即将推出的 Galaxy Book4 系列产品宣传材料中泄露了一些即将到来的 Copilot 功能。三星表示,Copilot “可以使用应用程序,总结短信内容,甚至可以直接从电脑发送短信”。这表明 Copilot 与 Phone Link 应用在三星 Galaxy 智能手机上将更深入地集成,目前 Windows 11 的稳定版本中还没有这些功能。
视频大模型初创公司「爱诗科技」获达晨亿级A1轮融资,目标3-6个月赶超Sora
视频大模型公司「爱诗科技」近日已完成亿级A1轮融资,本轮融资由达晨财智独家投资。光源资本担任独家财务顾问。公司称,资金将主要用于底层视频大模型的技术研发及团队搭建等方面。目前,海外市场,爱诗科技国际版AI视频生成产品 PixVerse 已经正式运营,用户可以通过网页端,或者加入Discord-PixVerse服务器进行体验。
马斯克表示xAI本周将让其聊天机器人Grok开源
马斯克今日下午通过 X(推特)宣布,自家人工智能公司 xAI 将在本周内开源人工智能助手 Grok。随后,马斯克在回应网友“OpenAI 也应当如此,如果它们要像名字中的‘Open’那样”的帖子时表示,“OpenAI 就是谎言。”
京东推出“AI 全能服务包”,帮助商家免费生成图文、视频和直播
京东日前宣布推出“AI 全能服务包”,各类 AI 工具免费生成图文、视频和直播,号称“帮助商家节省 50% 运营成本”。据介绍,京小智支持 7×24 小时自动接待,降低客服成本超 50%。“羚珑”工具可实现秒级免费生成图片,“京点点”支持秒级免费生成文案,支持 AI 生成视频。此外,京东还支持免费数字人“智能代播”,实现 24 小时不间断直播。
AI 热潮助力台积电股价创新高,重新跻身全球市值前十
台积电重新跻身全球十大最有价值公司之列,对人工智能(AI)的持续乐观情绪推动该公司股价升至创纪录水平。上周台积电股价上涨14%,市值达到创纪录水平,尽管周一早盘下跌2%,其市值降至6340亿美元。台积电市值仍然高于博通,使该公司自2020年以来首次重返全球市值前十俱乐部。
Meta 首席科学家 Yann LeCun:AI 毁灭人类的概率为零
近日,Meta 首席科学家、图灵奖得主 Yann LeCun 接受了科技博主 Lex Fridman 的深度采访。从探讨 LLM 的局限性、到揭示大模型幻觉、再到讨论 AGI 的挑战、以及对 AI 末日论的批判,这场近三个小时的采访不仅干货满满,也为我们认识和理解 AI 提供了新的视角。
OPPO 刘作虎内部讲话:AI手机不是噱头,3个月内友商必定都会跟进
OPPO高级副总裁、首席产品官,一加创始人刘作虎近日在一加内部会中回应了行业热议的AI手机话题。他表示,AI手机不是噱头,而是行业大势所趋,3个月内友商必定都会跟进。今年春节后,OPPO 提出了 2024 年是 AI 手机元年的观点,并专门召开了一场 AI 战略发布会,宣布成立 AI 中心。刘作虎当时在接受采访时表示,OPPO 将 AI 作为手机下一个时代最重要的战略,投入没有设置上限。
对标国防 AI 平台 Palantir,中科世通亨奇完成近 2 亿元
A+ 及 B 轮融资 数据智能解决方案提供商中科世通亨奇已于近日完成近2亿元A+及B轮系列融资,本次融资由多家产业资本与远致合创、乐礼资本等财务投资人共同投资,老股东达晨财智、元起资本持续加码。据了解,本次融资将重点用于国防领域大模型的研发迭代、数据平台基础技术创新、高端人才引进,以及在国防、政企和金融等行业的市场扩展。
英伟达被起诉滥用版权作品训练 NeMo 人工智能平台
作为人工智能(AI)热潮的最大受益者,英伟达(Nvidia)的芯片需求火爆、供不应求。但该公司近期似乎陷入了麻烦:已被三位作者起诉,称该公司未经许可使用了他们的版权书籍来训练其NeMo人工智能平台。Brian Keene、Abdi Nazemian和Stewart O’Nan这三位作者表示,他们的作品是大约196,640本书组成的数据集的一部分,这些书帮助训练NeMo模拟普通的书面语言,但在10月份“他们由于被报道侵犯版权”而被撤下。
黄仁勋:即使竞争对手的 AI 芯片免费提供,也无法击败英伟达方案
英伟达 CEO 黄仁勋最近声称英伟达的 GPU“非常好,即使竞争对手的芯片是免费的,但它也不够便宜”。黄仁勋进一步解释说,就 AI 数据中心的总拥有成本(TCO)而言,英伟达 GPU 的定价并不重要。黄仁勋称,英伟达以“完全开放的方式”运作,同时与业内几乎所有其他人合作。买卖芯片的人会考虑芯片的价格,而运营数据中心的人会考虑运营成本。当然,公司会很清楚总体拥有成本,这基本上意味着英伟达的优势,如部署时间、性能、利用率和灵活性。即使竞争对手的芯片是免费的,它也不够便宜。
黄仁勋透露英伟达下一代 DGX AI 系统将采用液冷技术
英伟达 CEO 黄仁勋已确认,其下一个 DGX AI 系统将采用液冷散热。这为数据中心领域带来了新的机遇。英伟达在一次会议上透露了该消息。数据中心和 AI 服务器领域一直在加快推进液冷步伐,各公司为液冷设备的制造工厂投入巨额资金。此外,液冷数据中心将需要大量的研发工作和足够的基础设施来维护。
2024年3月10日·周日
黄仁勋最新2万字对话全文:AI 缩小了人类间的技术差距,未来10年算力将再提高100万倍
2024年3月初,NVIDIA英伟达CEO黄仁勋(Jensen Huang)回到了他的母校美国斯坦福大学,参加了斯坦福商学院SIEPR经济峰会以及View From The Top 系列活动。在两场已公开的对话视频中,黄仁勋详细谈到英伟达的市场价值定位、AGI(通用人工智能)发展、AI 算力的增长,以及如何通过人类反馈将 AI 根植于人类价值观话题,而且他也回应对于“皮衣黄”来历等。黄仁勋坦言,AI 技术缩小了人类的技术差距。
OpenAI 视频生成服务 Sora 引发隐私担忧,意大利数据监管机构展开调查
意大利数据保护机构 (Garante) 周五宣布,已对微软支持的 OpenAI 公司开发的一项服务展开调查,这个名为 Sora 的服务可以根据文本提示生成视频。监管机构要求 OpenAI 澄清其向用户和非用户告知其产品 Sora 使用的数据的方式是否符合欧盟法规。OpenAI 公司暂未对此事发表评论。
李彦宏最新访谈:“未来编程语言只会剩中文和英文”、“文心大模型4.0在中文上已经超过了GPT-4”
在 3 月 9 日央视的《对话》・开年说节目上百度创始人、董事长兼首席执行官李彦宏表示,以后不会存在“程序员”这种职业了,因为只要会说话,所有人都能具备程序员的能力。“未来的编程语言只会剩下两种,一种叫做英文,一种叫做中文。”他还表示在中文上,文心大模型4.0已经超过了GPT-4。他以写诗为例,称像文心大模型等大模型都能写,但GPT不行。
文生视频平台 Pika 新增视频添加声音功能,可生成各种背景音效
文生视频平台 Pika 今日凌晨通过 X 平台官宣新功能:视频可以集成 AI 生成的音效了。用户现可在 Pika 生成的视频中无缝生成、整合声音,可以通过提示词来描述想要的声音,或者直接让 Pika 根据视频内容自动生成声音。“如果您觉得它很酷,那是因为它的确很酷。抱歉,我们之前静音了!”
OpenAI 首席技术官 Mira Murati 表示,她没有参与罢免 Sam Altman
OpenAI 首席技术官米拉·穆拉蒂 (Mira Murati) 通过社交平台 X 对《纽约时报》此前关于其在 Altman 罢免事件中起到了关键作用的报道发表评论,穆拉蒂说:“《纽约时报》的消息来源是前董事会成员,他们想把她当作替罪羊,以保全自己在媒体上的颜面。”她表示与 Altman 的关系“牢固且富有成效”,提供明确的反馈是其中的一部分。董事会要求她提供有关 Altman 的反馈,并向董事会讲述了她之前告诉 Altman 的事情。她从不支持董事会的行动。穆拉蒂在内部消息中写道:“我积极对抗这些行为,我们都努力让 Sam 回来。”
微软开始为 Copilot Pro 用户推出创建自定义 GPT 功能
微软 Bing 副总裁 Michael Schechter 表示,微软已经开始面向 Copilot Pro 用户推出 Copilot GPT Builder 功能,允许用户打造属于自己的自定义 AI 机器人。微软 Copilot GPT Builder 目前正在分阶段推出,拥有体验资格的 Copilot Pro 用户可以看到一个新的预览功能,点击即可通过自定义配置创建一个个性化 Copilot GPT。
2024年3月9日·周六
OpenAI CEO 奥特曼重返董事会,新增三名董事
据国外媒体报道,美国当地时间周五,人工智能初创企业OpenAI发布内部通知,该公司首席执行官山姆·奥特曼(Sam Altman)将重新加入董事会。OpenAI还任命了另外三名新董事,他们分别是比尔及梅琳达·盖茨基金会前首席执行官苏·德斯蒙德-赫尔曼(Sue Desmond-Hellmann)、索尼娱乐公司前总裁妮可·塞利格曼(Nicole Seligman)以及Instacart首席执行官菲吉·西莫(Fidji Simo)。这项新任命使监管OpenAI的非营利组织董事人数增加到7人。
云和AI数据中心独角兽 Astera Labs 寻求 IPO 融资至多 5.34 亿美元,估值高达 45 亿美元
半导体初创公司Astera Labs周五表示,其在美国首次公开募股(IPO)的估值最高可达45.1亿美元,这家“AI独角兽”芯片公司正寻求在人工智能热潮中上市。该公司表示,与部分现有股东一道计划出售1780万股股票,每股定价在27美元至30美元之间,筹资至多5.34亿美元。Astera将在此次发行中发行近1480万股股票,而出售股票的股东将发行约300万股。
2024年3月8日·周五
李彦宏:百度采用自研AI架构,国产芯片也能高效运行
据媒体报道,百度创始人、董事长兼CEO李彦宏在最近的财报电话会议上透露,虽然百度无法获得最先进的AI芯片,但国产芯片也能确保用户体验不受影响。李彦宏表示,美国限制了英伟达和AMD等厂商的高性能AI芯片的对中国出口,在短期内对百度的影响有限。据介绍,百度AI技术架构分为四层:芯片层、框架层、模型层和应用层,虽然芯片层受到了限制,但是百度在应用层、模型层和框架层都有很大的创新空间。“即使是使用性能较低的国产芯片,仍能维持高效率。”李彦宏表示。
OpenAI 将参与外部供应商设计流程,以获符合需求 AI 硬件
据英媒 Data Centre Dynamics 报道,OpenAI 正招募软硬件协同设计工程师,帮助外部供应商设计符合 OpenAI 自身需求的 AI 硬件。对内,该职位需要同 OpenAI 内部的机器学习工程师、内核工程师、编译器开发人员合作,了解他们对高性能加速器在机器学习技术、算法、数值近似、编程表达性和编译器优化等方面的愿景和需求。对外,该职位需要同多个外部供应商一起实现 AI 硬件的性能和可编程性目标,并协同第三方开发最佳内核,在 OpenAI 编译器中添加相关支持,最终对不同硬件配置的关键内核进行性能估算。
谷歌确认 Gemini Nano 本地大模型不会上线 Pixel 8 手机
Gemini Nano 作为谷歌为移动设备推出的 Gemini 大模型版本,能够处理不需要连接外部服务器的本地任务,仅支持谷歌 Pixel 8 Pro 手机。而今天,谷歌公司的相关人员在 YouTube 的一档节目中表示:由于一些硬件限制,Gemini Nano 不会出现在谷歌 Pixel 8 手机上。
上海:鼓励企业围绕“5G+”“VR+”“AI+”“北斗+”等领域加大研发投入力度
上海市印发《本市促进服务消费提质扩容的实施方案》。其中提到,促进信息服务消费产品研发。鼓励企业围绕“5G+”“VR+”“AI+”“北斗+”等领域加大研发投入力度,打造人工智能大模型、元宇宙、区块链等融合示范应用场景。聚焦文旅消费、职业培训、医疗健康等领域,推动建立一批标杆示范场景,形成一批元宇宙应用。支持在智能化教育教学、自动驾驶等领域构建示范应用场景。
Hugging Face 启动开源机器人项目,由前特斯拉科学家领导
机器学习和 AI 模型社区 Hugging Face 在特斯拉前任科学家 Remi Cadene 的领导下启动一个新的机器人项目,Cadene 在 X 上发布了该消息并表示,Hugging Face 机器人项目将是“开源的,而不是像 OpenAI 那样”。
消息称 OpenAI CTO 去年向董事会表达了对 Altman 领导风格的担忧,致后者短暂下台
据《纽约时报》报道,两名 OpenAI 高管在 Sam Altman 于 11 月下台之前对他表示了担忧。未具名消息人士称 OpenAI 首席技术官 Mira Murati 在 10 月份向董事会以及以备忘录的形式向 Altman 本人提出了对 Altman 领导风格的担忧。此外,知情人士称,大约在同一时间,OpenAI 联合创始人兼首席科学家 Ilya Sutskever 也表达了类似的担忧,并引用了他所描述的 Altman 的操纵行为历史。罢免事件几天后,Altman 重新担任首席执行官,但留下了许多关于所发生事件的疑问。
消息称三星挖台积电客户,有望拿下 Meta AI 芯片代工订单
三星晶圆代工事业紧追台积电之际,有消息称三星挖台积电客户,有望拿到Meta下世代自研AI芯片代工订单,将采2奈米制程生产,成为三星第一个2nm客户。目前Meta有两款AI芯片委由台积电生产,业界人士分析,三星晶圆代工事业最大的问题是良率,先前因良率不佳,已让苹果、高通及谷歌转至台积电下单,若三星代工Meta下世代AI芯片,双方合作是否顺利,关键仍在于良率。
谷歌 Gemini 现支持微调:可重新生成、缩短、扩充指定聊天内容
谷歌近日更新了 Gemini,让用户只需点击几下,就能修改回复的特定部分。过去,用户必须重新生成整个回复,但现在不再需要这样做了。只需选择要修改的回复部分,然后单击铅笔图标即可进行编辑。用户点击该图标之后,可以要求 Gemini 基于指定内容执行重新生成、缩短、扩充、移除操作。
人工智能初创公司 Inflection 推出 Inflection-2.5 模型,性能可与 GPT-4 相媲美
由原 DeepMind 联合创始人 Mustafa Suleyman 和 LinkedIn 联合创始人 Reid Hoffman 创办的人工智能初创公司 Inflection 推出 Inflection-2.5 模型,现已向所有 Pi 聊天助手的用户开放,可通过pi.ai、iOS、Android或其新的桌面应用程序使用。官方表示 Inflection-2.5 接近 GPT-4 的性能,但相比仅使用了 40% 的计算量用于训练。
Adobe Express 移动端应用公测 Firefly 生成式 AI 功能
Adobe 为其基于云的移动设计平台 Adobe Express 进行了更新,为 iOS 和 Android 设备带来了与桌面端用户相同的创意、编辑和 Firefly 驱动的生成式 AI 功能。新版 Adobe Express 应用程序测试版提供免费试用,允许用户借助 AI 轻松制作社交媒体帖子、海报和网站横幅等创意资源。
印度宣布投资 12 亿美元用于人工智能项目
印度政府表示,周四批准了对人工智能项目的 1030 亿卢比(12.5亿美元)的投资,包括开发计算基础设施和大型语言模型的开发。声明中表示,这笔资金还将用于资助人工智能初创公司,以及为公共部门开发人工智能应用程序。据 IT 行业机构 Nasscom 称,到 2027 年,印度人工智能市场预计将达到 170 亿美元,2024 年至 2027 年间年化增长率为 25%-35%。
2024年3月7日·周四
微软将举行线上新品发布会,发布 Windows 11 系统更新、Copilot 功能及 Surface 系列新品
微软今天发布了一个特别活动页面,确认将于太平洋夏令时 3 月 21 日上午 9 点(北京时间 3 月 22 日凌晨 1 点)举办名为“办公新时代”的线上新品发布会,届时将发布全新 Windows 11 系统更新、Microsoft Copilot 功能以及 Surface 系列新品。
2024世界人工智能大会7月4日至6日举办
3月7日,2024世界人工智能大会(WAIC)启动会宣布,2024世界人工智能大会将于7月4日至6日在上海举办。上海市经信委人工智能发展处处长王志佳表示,将继续加大对人工智能领域的投入和支持,全力支持企业在底层技术上加快突破,在产业应用上加大创新,在商业化之路上加快落地。
台积电启动“大扩产”,以应对AI芯片需求
为应对客户对AI芯片需求,台积电再度启动大扩产,预计四月将展开装机与在建中的2nm晶圆厂、先进封装厂共达十座。另外,供应链指出,继2nm之后,台积电还将推进到1.4nm、1nm先进制程;厂商透露,1nm世代在台湾地区投资建厂大概需要8-10座厂。
阿里国际站推出AI极简出海计划,上线AI智能投放等功能
阿里国际站宣布面向外贸新商家推出“AI极简出海”计划。据了解,新入驻的商家可以借助AI能力快速开店,7天就能上手外贸生意。同时,阿里国际站表示将为新商家保商机:每2个月获得50条优质商机。据测算,新入驻的商家全年平均可获得600条左右的商机。
谷歌 Gemini 被曝翻车内幕:内部群龙无首,生图机制过分“多元化”
谷歌Gemini文生图风波还未平,更劲爆的内幕消息又被曝出来了。Pirate Wires爆料,Gemini这次的翻车,谷歌内部此前并不是毫不知情,翻车甚至是“故意”导致的。具体来说,谷歌设置了一个“安全”架构,Gemini要生成一张图实际上要经过三个模型。
华为哈勃入股清昴智能,后者为AI部署优化技术提供商
天眼查App显示,近日,清昴智能科技(北京)有限公司发生工商变更,新增华为旗下深圳哈勃科技投资合伙企业(有限合伙)为股东,同时注册资本由约234.6万人民币增至约254.9万人民币。公开信息显示,清昴智能是一家AI模型部署优化技术提供商。
Midjourney 封禁 Stability AI,称其恶意爬取数据,致服务器瘫痪 24 小时
根据爆料者的信息显示:「Midjourney 服务器上周六凌晨受到与 Stability AI 数据收集工程师相关账户的严重攻击,这些账户正在大量爬取提示词和图像,导致 Midjourney 服务器 24 小时中断。在禁止该帐户并进一步调查后,Midjourney 员工发现该帐户通过两张信用卡与 Stable Diffusion 团队的一位主要数据收集工程师相关联。作为回应,Midjourney 已决定禁止 Stability AI 的所有员工使用其软件,直至另行通知。」但是 Stability AI CEO Emad 表示他并不知情,并表示:「令人困惑的是,2 个帐户是如何把服务整崩的,况且我们没有抓取数据,我们一直在使用合成数据和其他数据(来训练模型)。」
SK海力士投资10亿美元,扩大对先进芯片封装投入
SK海力士正在韩国投资逾10亿美元,以优化芯片封装工艺、扩大芯片封装产能,从而抓住市场对高带宽内存(HBM)需求日益增长而带来的机遇。不仅是在韩国,SK海力士还计划在美国建立价值数十亿美元的先进封装厂,而这些投资,将为满足未来几代HBM的需求奠定基础。
Meta 欲打造巨型 AI 模型:推动旗下视频推荐引擎发展
据媒体报道,互联网巨头Meta正打算开发一种堪称“巨型”的人工智能系统,希望为旗下Facebook的整个视频推荐引擎提供新的驱动力。Facebook负责人汤姆·埃利森(Tom Alison)表示,这一超大规模人工智能推荐模型的开发,是Meta“到2026年的技术路线图”的一部分。该模型不仅能支持类似TikTok的“Reels短视频服务”,也能支持更传统的长视频。
硅基流动正在考虑是否进行新一轮融资,投资人已备好弹药
《中国企业家》独家获悉,袁进辉正在考虑是否进行新一轮融资,投资人已备好弹药,名单中不乏互联网大公司。袁进辉向《中国企业家》透露,他正在权衡各方利益,比如是否接受来自互联网大厂的投资,但他不太想过早站队。“比如你做到下一个里程碑,也许不需要这么多钱,或者你拿多了,其实是预支了未来的筹码。”袁进辉说。资金对当下的袁进辉来说并不急迫。就在今年1月,硅基流动刚完成天使轮融资,由创新工场、奇绩创坛以及耀途资本等总计投了约5000万元。王慧文也出手支持,他还是持股5%的初始股东。与其他明星初创公司对标OpenAI不同,硅基流动瞄准的赛道是选择做大模型时代的AI基础设施(AI Infra),降低大模型应用成本和开发门槛。
井工矿无人驾驶企业「雷科智途」完成一亿元A轮融资
商用车自动驾驶企业「雷科智途」已经完成一亿元人民币A轮融资,该轮融资由中关村资本和中关村创投领投,中信建投、北京首都科技发展集团和老股东考拉基金跟投,北京智慧硅谷担任独家财务顾问。本轮资金主要用于领先产品的持续迭代,生态上下游合作推动,以及落地场景延展。
外交部长王毅谈人工智能全球治理:确保有益,确保安全,确保公平
外交部长王毅在两会记者会上谈及人工智能全球治理,他表示,人工智能进入爆发式发展的关键阶段。我们主张发展与安全并重,既要拥抱新事物新机遇,也要装好刹车再上路,共同推进人工智能全球治理。我们关注的是三个确保:确保有益、确保安全、确保公平。“如果企图在人工智能上也搞什么“小院高墙”,将会犯下新的历史错误,不仅阻挡不了各国的科技发展,还会破坏国际产业链供应链完整,削弱人类应对风险挑战的能力。”
权力与背叛:马斯克与奥特曼如何从兄弟情走向商业对决
据国外媒体报道,作为人工智能领域的佼佼者,OpenAI首席执行官山姆·奥特曼曾视埃隆·马斯克为自己的“导师”。然而,随着两人在商业理念上的分歧不仅导致他们在创业路上分道扬镳,因此陷入了一场激烈的纷争。马斯克指责奥特曼为了追求利润而背离了OpenAI的初衷,而后者则坚决否认。这场纷争不仅暴露了马斯克与奥特曼之间的问题,也凸显了人工智能领域的力量平衡正被打破。本期《硅谷封面》梳理和再现奥特曼与马斯克之间,一场“兄弟情反目”的恩怨故事。
马斯克发图讽刺奥特曼:你的公司应该叫 ClosedAI
特斯拉CEO埃隆·马斯克周三在X平台上发布一张恶搞图片讽刺OpenAI及其CEO萨姆·奥特曼,暗示该公司应该改名为ClosedAI,因为拒绝恢复开源。马斯克发布的是一张奥特曼在去年11月“政变”风波中受邀重返公司讨论复职事宜时的自拍照,但奥特曼展示的门禁卡上的公司名被P成了“ClosedAI”。
微软 Microsoft 365 版 Copilot 4 月 1 日面向高校推出,拥有 A3 / A5 许可证可免费用
微软表示,具有商业数据保护功能的 Microsoft Copilot 现已嵌入所有 Microsoft 365 教育产品中,包括零成本许可证,将提供给所有 18 岁及以上的教师和高校学生,并将在今年春季启动针对年轻学生的私人预览计划,拥有 Microsoft 365 或 Office 365 A3 / A5 许可证的学生即可免费使用。来源: IT之家 GPT-4 被曝侵权问题最为严重,微软员工称图像生成功能也令人担忧 Patronus AI高管告诉媒体,在所有模型的评估中都发现了版权内容侵权,GPT-4在这方面表现最差。此外,微软AI工程师Jones致信美国FTC和微软董事会,称公司的AI图像生成工具可能会对社会构成危险。
上海AI实验室开源发布高质量语料“万卷CC”
近日,上海人工智能实验室(上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”(WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符(100B token),约400GB的高质量英文数据。作为“大模型语料数据联盟”今年首发的开源语料,WanJuan-CC将为学界和业界提供大规模、高质量的数据支撑,助力构建更智能可靠的AI大模型。
Snowflake 宣布与法国人工智能初创公司 Mistral AI 合作并对其投资
Snowflake 宣布与 Mistral AI 合作,将其强大的语言模型直接提供给数据云中的客户。此次合作包括 Snowflake Ventures 在 Mistral A 轮融资中的投资,旨在为企业提供利用大型语言模型所需的工具,同时维护数据安全和治理。通过此次合作,Snowflake 客户可以获得 Mistral AI 的旗舰大模型 Mistral Large 的使用。
2024年3月6日·周三
零一万物发布并开源 Yi-9B,代码数学综合能力全面增强
今天,零一万物开源了 Yi-9B 模型,它是当前 Yi 系列模型中的“理科状元”——代码和数学能力表现最佳;不偏科,中文能力也很强。这是继今年1月23日开源多模态模型 Yi-VL-34B 之后,零一万物在开源方向上的又一重要成果。在综合能力方面(Mean-All),Yi-9B 的性能在尺寸相近的开源模型中最好,超越了 DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B 和 Gemma-7B。
英伟达CFO: AI基础设施市场规模有望达到2万亿美元,英伟达不仅仅是硬件公司
英伟达CFO Colette M. Kress在刚刚召开的2024年摩根士丹利TMT大会上表示,看到了AI和加速计算的巨大商业潜力,预计AI基础设施市场规模将远不止现在的1万亿美元。她说,英伟达首席执行官黄仁勋曾在一次路演中表示,该市场规模可能接近2万亿美元。Kress表示,英伟达不仅仅将自己定位为一个提供AI芯片的硬件公司,而是一个为数据中心提供整体加速计算解决方案的公司。
2024 百度 AI 开发者大会将于 4 月 16 日-17 日举行
百度日前宣布,2024 百度 Create AI 开发者大会将于 2024 年 4 月 16 日至 17 日在深圳国际会展中心(宝安)举办,届时不仅会带来 AI 技术的最新进展,还将设置超 30 节“AI 公开课”。据官方介绍,在“AI 公开课”环节,由多位百度主任架构师领军的技术团队将手把手教用户打造 AI 原生应用,并传授大模型研发的实战经验,包括千帆 AppBuilder、Comate 以及百度文库等。
阿里国际站 AI 发布商品数量达百万,海外搜索量提升 37%
3月6日,在CCBEC和阿里国际站联合举办的“2024跨境电商增长新趋势大会”上,阿里国际站透露,AI外贸产品推出仅仅小半年,就已经有1.2万家外贸企业订购使用,AI发布的商品已经达到百万规模,而通过AI优化这些产品在海外的搜索量提升达到了37%。
消息称微软本月将发布首批 AI PC,搭载“AI Explorer”功能
据 WindowsCentral 报道,微软将于本月晚些时候发布新款 Surface Pro 和 Surface Laptop 硬件,将成为微软首批“AI PC”,支持今年晚些时候即将登陆 Windows 11 的特殊 AI 功能。据消息人士称,“AI Explorer” 是将 AI PC 与非 AI PC 区分开来的重磅 AI 体验,其被描述为“高级 Copilot”,并内置历史记录 / 时间线功能,可以将用户在电脑上做的所有事情转换为可使用自然语言搜索的时刻,可以在任何应用中工作,允许用户搜索之前打开的对话、文档、网页和图像。
QQ 测试 AI 聊天搭子,腾讯字节再战 AI 社交
社交,仍然是一个不过时的赛道,QQ和抖音最近都推出了AI社交功能和产品。日前,QQ的AI对话功能已开启测试,名为“AI聊天搭子”,由QQ联合筑梦岛、混元助手合作的一项AI对话服务。而抖音则是上线了一款名为“话炉”的AI社交APP,由字节的Flow部门打造。
「千丘智能」获千万级天使轮融资,提供孤独症儿童康复训练 VR 数字疗法
精神康复数字疗法企业 「千丘智能」 日前完成千万级天使轮融资,本轮融资由睿资创投领投,中岚科创任长期财务顾问。相关医疗器械注册许可正在申请中,融资资金将用于产品研发及市场拓展。千丘智能成立于2021年,基于AI+VR技术为自闭症儿童提供前期诊断-康复训练-训练后评估的全流程数字疗法方案。
功耗降低30%!AMD推出全新16nm FPGA芯片组合,用于医疗、机器人等边缘场景
芯片巨头AMD公司今晨推出AMD Spartan UltraScale+ FPGA系列产品组合。这是该公司对于成本敏感客户提供的 FPGA(现场可编程逻辑门阵列)和自适应SoC(系统级)产品组合中的一个新系列。AMD表示,Spartan UltraScale+产品提供基于28nm及以下制程技术构建,最新FPGA芯片则采用16nm FinFET先进工艺,具备多达572个 I/O 和高达3.3v的电压支持,功耗降低高达30%,可应用于嵌入式视觉、医疗保健、工业网络、机器人和视频等场景。
OpenAI 回应马斯克起诉,称对事情发展到这个地步感到难过
OpenAI在其网站上发布博文回击埃隆·马斯克,就这位联合创始人和前赞助人提起的诉讼作出回应。OpenAI在博文中称,马斯克在试图将该公司纳入特斯拉但未能成功后,对公司大加挞伐。“和一位我们一直深感钦佩的人走到这一步,我们感到难过。”OpenAI在帖子中写道,“他曾激励我们志存高远,然后告诉我们会失败,进而创立一个竞争者,终至于把我们告上公堂,而此时我们在没有他在场的情况向正开始向着OpenAI的使命踔厉奋发。”
郭明錤:若苹果无法推出超预期生成式AI服务,市值或被英伟达超越
天风国际证券分析师郭明錤表示,先前2024年iPhone出货的市场共识为2.2-2.25亿部,现在已经开始下修,并向他之前预测的2亿部靠拢。如果苹果今年无法推出优于市场预期的生成式AI服务,英伟达的市值将很有可能超越苹果。
2024年3月5日·周二
政府工作报告:制定支持数字经济高质量发展政策,开展“人工智能+”行动
十四届全国人大二次会议5日上午在人民大会堂开幕,国务院总理李强向大会作政府工作报告。政府工作报告称,制定支持数字经济高质量发展政策,积极推进数字产业化、产业数字化,促进数字技术和实体经济深度融合。深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。
Anthropic 发布 Claude 3 系列大模型,号称已超越 GPT-4 和 Gemini 1.0 Ultra
人工智能初创公司 Anthropic 宣布推出新一代 Claude 3 系列大模型,该系列大型语言模型 (LLM) 在各种认知任务上树立了新的性能标杆。Claude 3 系列包含三个子模型,分别为 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用需求。据官方称,Claude 3 系列的旗舰模型 Opus 在本科和研究生水平的知识、数学和复杂任务理解方面均超越了 OpenAI GPT-4 和谷歌 Gemini 1.0 Ultra。
消息称 AMD 向国内销售定制 AI 芯片的计划遭遇美国政府阻挠
据知情人士透露 AMD 公司在试图销售专为中国市场定制的人工智能芯片时遇到了美国政府的障碍,这是华盛顿打击向中国出口先进技术的一部分。据这些不愿透露姓名的人士称,AMD 曾希望从美国商务部开出绿灯向中国客户销售人工智能处理器。他们说,这款芯片的性能低于 AMD 在中国以外销售的产品,其设计符合美国的出口限制。但美国官员告诉 AMD,这款芯片的功能仍然过于强大,该公司必须获得商务部工业与安全局的许可才能销售。
ChatGPT 新增语音朗读功能 Read Aloud,可将文本内容转化为语音
OpenAI 针对 ChatGPT 的新语音朗读功能 Read Aloud 上线,向用户提供五种语音选项响应,现已可在 ChatGPT 的网页版本以及 iOS 和 Android ChatGPT 应用程序上使用。Read Aloud 可以讲 37 种语言,会自动检测正在阅读的文本的语言,并且该功能适用于 GPT-4 和 GPT-3.5。
OpenAI、谷歌、微软、Meta、YC 等公司签署 AI公开信
OpenAI、谷歌、微软、Meta、YC、Salesforce 和其他科技公司及投资机构签署了一封名为 “Build AI for a Better Future” 的公开信,强调了“最大限度地发挥人工智能的好处并降低风险”和对社会的“集体责任”。OpenAI 首席执行官 Sam Altman 在社交媒体平台X上发帖表示,他“对这封信的精神感到兴奋”。该联名信是由风险投资家 Ron Conway 和他的投资公司 SV Angel 发起的。Altman 表示,人工智能的进步“将成为改善人们生活质量的最大因素之一。” Hugging Face、Scale AI、Mistral AI 和其他数十家初创公司和科技公司也被列为这封信中的签名者。
摩根士丹利:算力投资进入第二阶段,“AI数据中心”接棒“芯片”
正如黄仁勋高喊未来4年数据中心升级将开支1万亿美元,眼下随着算力周期的发展进入第二阶段,红利也逐渐开始从芯片转向基础设施。而其中摩根士丹利直指数据中心,认为其将带来新一波AI投资浪潮。在3月1日的最新研报中,摩根士丹利表示,下一波投资将更多聚焦AI数据中心的其他基础设施,比如服务器、网络设备、冷却系统、数据存储,乃至实体房地产等。
2024年3月4日·周一
苹果发布新 MacBook Air,号称「最好的 AI 消费级笔记本」
没有预告,没有发布会,苹果突然更新推出了 Macbook Air。MacBook Air 最大的变化要属「换芯」,正式进入了 M3 时代。升级的 Air 配备了 8 核中央处理器和最高达 10 核图形处理器,支持最高达 24GB 统一内存。 同时,M3 芯片采用 3 nm 工艺打造,使得 MacBook Air拥有比上代更快的性能和更丰富的功能。在 M3 芯片的加持下,macOS 提供智能功能,可提高工作效率和创造力,并且用户可以实现实时语音转文本、翻译、文本预测、视觉理解、辅助功能等。除了设备性能外,MacBook Air 还支持基于云的解决方案,使用户能够运行强大的生产力和创意应用程序,以利用 AI 的力量。
英伟达超越沙特阿美,成全球市值第三高上市公司
人工智能芯片巨头英伟达市值超过沙特阿美,成为微软和苹果之后全球市值第三高的上市公司。数据显示,截至上周五美股收盘,英伟达的市值达到2.06万亿美元,首次迈过2万亿美元大关,而沙特阿美的市值降至2.03万亿美元。英伟达的业绩井喷式增长再次证实了华尔街对人工智能重塑科技行业潜力的乐观态度,这推动了英伟达股价飙升。继去年涨逾239%之后,英伟达今年以来维持强劲涨势,年初至今涨幅已超过66%,市值增加了约8340亿美元。
摩根大通称其 AI 现金流管理工具可削减部分流程近 90% 人工工作
摩根大通利用AI现金流管理工具帮助部分企业客户将将支付流分类和可视化方面的人工工作削减近90%。摩根大通批发支付部门的数据和分析主管Tony Wimmer接受采访称,这个名为“现金流情报”(Cash Flow Intelligence)的工具可让企业的财务部门分析和预测现金流,获得客户“极为浓厚的”兴趣。他表示,约一年前启动以来,该产品目前的客户已达近2500个。目前该产品供客户免费使用,摩根大通正考虑将来对该解决方案收取费用。
消息称 AI 大模型初创公司 MiniMax 正进行新一轮大规模融资,阿里为其中的核心领投方
据《科创板日报》报道,通用大模型初创项目 MiniMax 正在进行新一轮大规模融资,阿里为其中的核心领投方。知情人士表示,目前MiniMax最新一轮融资还在进行中,最终金额尚未完全确定,“但也会是像月之暗面一样的大额融资。”截至发稿,MiniMax 及阿里方面均未回复记者的求证。此前,MiniMax 已完成3轮融资,投资方包括腾讯、米哈游等。
AI 大模型初创公司「新旦智能」完成千万级的天使轮融资
近日,总部位于深圳的AI初创公司新旦智能完成了千万级别的天使轮融资,由全球化人工智能企业APUS与AI行业资深投资人周弘扬联合投资。相比国内其他大模型公司,新旦智能略显年轻,但创始团队阵容却颇为豪华:这是一支由清华、伯克利、腾讯、Meta等*学术与工程界精英组成的团队,成员包括全球*的开源AI社区知名开发者、资深腾讯云架构师等。
印度提出新要求:科技公司发布生成式 AI 工具之前,需获得政府许可
据路透社、外媒 TechCrunch 北京时间今日报道,印度信息技术部于当地时间上周五发布公告:各家科技公司在发布生成式 AI 相关工具、新的模型之前,需要获得印度政府的明确许可。印度信息技术部副部长拉吉夫・钱德拉塞卡尔表示,该建议针对的是“在印度互联网上部署的、未经测试的人工智能平台”,而非初创公司。钱德拉塞卡尔今天在 X(推特)上的帖子中表示,该建议针对的是“在印度互联网上部署的、未经测试的人工智能平台”,而非初创公司。
英伟达新一代AI芯片B200功耗将达1000W,预计2025年问世
PC和服务器制造商戴尔透露了英伟达即将推出的人工智能(AI)GPU,代号为Blackwell。这些芯片的功耗高达1000W,比上一代芯片的功耗增加40%。戴尔首席运营官Jeff Clarke表示,戴尔为配合B200服务器GPU的推出,届时也将提供旗舰级的PowerEdge XE9680机架服务器。另外,采用Blackwell架构B100与B200最快要到2025年才会推出,与先前预期推出的时间有所落差。
微软增强 Copilot 功能:拖拽文件即可提问
继 Adobe 推出 PDF AI 帮助用户快速理解庞大报告,以及 Copilot 能分析 OneDrive 文件并回答相关问题之后,Copilot 又迎来了新功能:直接拖拽文件提问。用户只需将文件拖拽至 Copilot 的聊天窗口,AI 助手便能读取内容。随后,用户可以向 Copilot 提问,例如要求其总结文档要点、查找特定数据或提供主题相关信息。不过这个功能目前似乎还未向所有用户开放。
网传 53 页 PDF 称「OpenAI 计划在 2027 年实现 AGI」,真实度未知
一份关于「OpenAI 在 2027 年实现 AGI」的 53 页 PDF,正在互联网上广泛流传。文档来源于一个名为「vancouver1717」的 X 账户,该账户注册于 2023 年 7 月,只有两条推文。最新发布的这个 PDF 文档称,OpenAI「将在 2027 年前开发出人类水平的 AGI」,「从 2022 年 8 月就在训练 125 万亿参数的多模态模型」,而且已经「在 2023 年 12 月完成了训练」,但是「由于高推理成本取消了发布」。其中提到,这个模型就是原计划 2025 年发布的 GPT-5,取消之后,Gobi(GPT-4.5)更名为 GPT-5。文档里还提到了去年就被曝光的神秘项目 Q*,说法是 Q * 的下一阶段最初是 GPT-6,但已更名为 GPT-7(原计划 2026 年发布)。内容真实度未知,读过的人倾向于「不信」,因为很多判断缺乏专业度。
阿里测试针对商家和达人的 AI 电商营销工具“绘蛙”
据Tech星球报道,阿里成立了一支AI电商团队,目前正在打造一款针对商家和达人的AI电商产品 “绘蛙” 。绘蛙官网显示,其开发主体为杭州连凡信息技术有限公司,根据工商信息显示,该公司由阿里巴巴(中国)有限公司100%持股。据悉,“绘蛙”将为淘宝、天猫商家和达人在生成营销文案、训练专属AI模特等方面提升创作效率,使商品快速被种草。这是阿里在AI电商上的一次实质化的布局。
雷军:建议从义务教育阶段普及人工智能素养教育
小米集团董事长雷军表示,作为全国人大代表,今年准备了4份建议案。其中关于人工智能提案提及,从长期趋势看,各行各业对掌握人工智能基本技能的人力需求正急剧增长,以我国生成式人工智能的实际技术水平来看,特别是在顶尖人工智能人才储备方面还存在明显不足,人工智能复合型人才更加短缺。建议从义务教育阶段普及人工智能素养教育。大力推进高校人工智能相关专业的建设。支持大型科技企业和教培机构培育人工智能应用型人才。
雷鸟创新获得新一轮亿元级融资,目标打造「最佳AI硬件」
消费级AR品牌雷鸟创新完成新一轮亿元级融资,本轮融资由华泰紫金、燕创集团等多家机构联合投资,融资金额将用于新一代消费级AR眼镜的技术研发、量产和市场普及,以及推动AI+AR眼镜生态建设。
2024年3月3日·周日
北京:积极推动高校、科研院所、新兴研发机构构建工业人工智能大模型
北京市经信局近日发布的《北京市制造业数字化转型实施方案(2024-2026年)》提出,打造人工智能创新应用示范。积极推动高校、科研院所、新兴研发机构构建工业人工智能大模型,推进人工智能技术在制造业垂类细分领域的创新应用。征集一批人工智能大模型制造业细分领域的垂类示范应用及解决方案,鼓励形成典型应用、形成推广案例,对实现首次应用的优秀方案给予500万元的奖励。
AMD CTO 访谈:AI 推理芯片需求猛增,GPU 供应短缺必将缓解
AMD CTO及执行副总裁Mark Papermaster近期参加了播客节目《史无前例:人工智能、机器学习、技术与初创企业》,回答了AMD的战略、最新的GPU进展、推理芯片部署的位置、芯片软件栈,以及他们如何看待供应链,投资者应该对于2024年的AMD有哪些期待等问题。Mark Papermaster称,电力是芯片发展的关键限制因素,提高能效绝对是AMD最高优先级。
Sam Altman 个人身家已至少 20 亿美元,还不包括 OpenAI 持股
数据显示,为OpenAI首席执行官Sam Altman个人财富已经至少20亿美元,而且这一数字并不包括他在OpenAI的任何持股。根据媒体报道,这是首次对他的个人财富进行估值。Altman可追溯的大部分财富来自于一个VC基金和一些初创投资,而且随着Reddit的首次公开募股,他的财富预计将继续增长,因为与他有关的基金是Reddit最大的股东之一。Altman的财富并未计入OpenAI的持股,目前该公司估值已达到860亿美元。不过Altman曾多次表示,他并不拥有该公司的股权。Altman拒绝对此发表评论。
谷歌 DeepMind 推出新的基础模型「Hawk」和「Griffin」
在谷歌 DeepMind 近日的一篇论文中,研究者提出了 RG-LRU 层,它是一种新颖的门控线性循环层,并围绕它设计了一个新的循环块来取代多查询注意力(MQA)。他们使用该循环块构建了两个新的模型,一个是混合了 MLP 和循环块的模型 Hawk,另一个是混合了 MLP 与循环块、局部注意力的模型 Griffin。
日本 ATM 机引入 AI 识别系统,帮助老年人远离电信诈骗
由于日本人口老龄化日趋严重,老年人已经成为电信诈骗主要受害群体之一,经常会有不法分子假扮成老人亲属,以遇到麻烦且不方便出面为由,通过电话指挥老人使用 ATM 机完成转账。据央视新闻,日本警方为此在部分 ATM 机中安装 AI 识别系统,向潜在受害者发出警示。
复旦大学团队研发“眸思”大模型,助视障者“看见”世界
据复旦大学官方公众号,在复旦大学自然语言处理实验室 (FudanNLP) 师生的努力下,基于多模态大模型“复旦・眸思”(MouSi) 为视障者量身打造的“听见世界”App 上线。这套系统仅需一枚摄像头、一对耳机,就能将画面转化为语言,且支持描绘场景、提示风险等功能。
2024年3月2日·周六
抖音核心成员们,已经 All in AI
抖音的历代核心成员已经超过半数All in AI,他们有的自己下场创业或者加入创业公司,有的继续在字节内部“始终创业”,这也让我们看到,这一波AI,字节人已经率先入局。目前除了长期主导抖音的字节三张(字节的三巨头,张一鸣、商业化老大张利东及张楠)之一的张楠(Kelly)外,包括Musical.ly(Tiktok的前身)的两位创始人阳陆育(Louis)和朱骏(Alex),抖音初代负责人任利锋(卷卷)、抖音创始成员及运营负责人李恬(大恬),从未真正意义上管理过抖音的产品负责人王京津(Seven),Tiktok产品技术负责人朱文佳,还有从大中台拆到小中台的抖音基础产品及用户增长负责人吴晓丹,抖音社交负责人陆游,均从事AI应用落地业务。
解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品
来自理海大学、微软研究院的华人团队发布了首个Sora相关研究综述,足足有37页。他们基于Sora公开技术报告和逆向工程,对模型背景、相关技术、应用、现存挑战以及文本到视频AI模型未来发展方向进行了全面分析。连计算机视觉领域的AI生成模型发展史、近两年有代表性的视频生成模型都罗列了出来。
魅族 21 Pro 手机今日首销:旗下首款开放式 AI 终端,4999 元起
魅族 21 Pro 手机于今日 10 点全渠道开售,搭载 Flyme AI、 mTouch Max 广域超声波指纹识别、5000 万双 OIS 镜头等,售价 4999 元起。这款新机号称“魅族首款开放式 AI 终端”,Flyme10.5 依托 AI 大模型将逐步上线多项 AI 趣味实用功能,例如 Aicy 语音化身随叫随到贴身助理,可以实现高效撰写文案、语音生成多种风格画作;图库在 AI 加持下支持自然语言搜图。
英伟达 CEO 黄仁勋:AI 将在五年内通过任何测试
英伟达CEO黄仁勋在美国加州参加斯坦福经济政策研究所峰会时表示,他预计通用人工智能(AGI)最快将在五年内面世,届时人工智能将可以通过任何人类的测试。黄仁勋还认为,OpenAI CEO萨姆·奥特曼希望以5万亿美元至7万亿美元的巨资打造芯片制造网的计划“大可不必”。
OpenAI回应:“断然不同意”马斯克的诉讼
美媒Axios、彭博社援引OpenAI内部备忘录报道称,该公司高管驳回了联合创始人马斯克对其提起诉讼的理由。备忘录称,该公司仍然独立,致力于造福人类,尚未在其产品中实现通用人工智能。“(马斯克的)指控,包括GPT-4是AGI,以及我们是微软事实上的子公司等说法,并没有反映我们工作或任务的现实。”OpenAI首席战略官杰森·权说。杰森·权强调,OpenAI“断然不同意”马斯克对公司提起的诉讼,马斯克的说法“可能源于他后悔如今无法参与到OpenAI运营中来”。
新闻媒体 CNET 由于使用 AI 生成文章,维基百科不再视其为可靠信源
维基百科有一个名为“可靠来源 / 常用来源”(Reliable Sources / Perennial Sources)的页面,其中列出了可信和可靠的新闻来源。CNET 于 2022 年开始使用 AI 来生成部分文章,但因为文章中存在大量语法错误,且存在严重的抄袭行为,大幅损害了其声誉。面对负面评价和外界压力,CNET 随后叫停了 AI 项目,并纠正了大量文章中的错误。维基百科的编辑们经过调查、投票判定,在 2022 年 11 月至 2023 年 1 月期间发表在 CNET 上的任何内容都应被视为“普遍不可靠”(generally unreliable)。
2024年3月1日·周五
马斯克起诉 OpenAI 及其 CEO 奥特曼,称其违反了开源开放的初衷
当地时间周四晚间,特斯拉CEO埃隆·马斯克向旧金山高等法院提起诉讼,以违反合同为由起诉OpenAI及其CEO萨姆·奥特曼。马斯克在诉讼中表示,奥特曼和OpenAI违背了这家人工智能研究公司成立时达成的一项协议,即开发技术以造福人类而不是利润。马斯克声称,OpenAI最近与科技巨头微软的关系损害了该公司致力于公共、开源的通用人工智能的初衷。
首部由 AI 制作的长篇“电影”《我们的终结者2重制版(Our T2 Remake)》将于下周首映
一部“完全由AI制作的开创性长篇电影”即将在洛杉矶 Landmark Nuart Theater 首映。50 位 AI 领域艺术家组成一个创作团队,创作出了《终结者2》翻拍作品——《我们的终结者2重制版(Our T2 Remake)》。该片并不只是单纯的翻拍重制,其呈现了一个人类对抗ChatGPT统治的世界,探讨当代AI发展的影响。“这将是AI在电影制作应用中的一个重要里程碑……我们希望向世界展示,AI赋予了每一个人创作自己的史诗级故事的能力。”电影制作团队如此表示。
马斯克:AI发展速度前所未见,希望人形机器人“善待”人类
2月29日,在博世集团举办的BCW(Bosch Connected World)活动上,特斯拉CEO埃隆·马斯克接受连线采访并谈论了他对未来5到10年内人工智能发展进程的看法。对于人工智能技术的发展,马斯克评价说,“人工智能技术进展迅速,实际上,我从未见过哪种技术能比其进步更快。”马斯克提到,英伟达拥有最好的神经网络芯片,其市值甚至可能会继续增长,“芯片热潮比此前的任何一次淘金热都要庞大。”此外,马斯克认为,人形机器人也是人工智能的一大应用领域,特斯拉的人形机器人擎天柱就是一个例子,擎天柱是人形机器人,几乎能做任何人类能做的事。不过马斯克一如既往地保持着对人工智能安全的质疑态度,他笑着说,“我只希望机器人能够友善对待我们。”
多模态大模型企业「联汇科技」宣布完成新一轮数亿元战略融资
近日,杭州联汇科技股份有限公司(以下简称 “联汇科技”)宣布完成新一轮数亿元战略融资,投资方由中国移动产业链发展基金中移和创投资、前海方舟(前海母基金管理机构)旗下中原前海基金和齐鲁前海基金等多家头部国资与市场化机构组成。据悉,本轮融资将主要用于多模态大模型及自主智能体的技术研发、产品创新及市场拓展,扩大其在运营商、能源电力、媒体等国家基础行业与重点细分市场的领先优势。
OpenAI 拟于 3 月份任命多位新的董事会成员以应对监管压力
据国外媒体报道,人工智能初创公司OpenAI计划在3月份任命多位新董事会成员,此举意在应对该公司日益增长的监管压力。据内部知情人士透露,自2023年11月对公司治理架构进行大规模改组以来,OpenAI的董事会即将迎来新成员。与此同时,另两位知情人士爆料称,美国证券交易委员会(SEC)正在调查OpenAI是否存在误导投资者的行为。
网易丁磊:重视AIGC在各场景的应用,《蛋仔派对》将探索出海
“今天AI能做到的事情,比过去十年还要重大。”网易首席执行官丁磊在财报电话会上表示。他认为,这一轮AI技术浪潮,将极大的提高内容中位数的质量。网易非常重视AIGC在游戏、音乐等各个场景的应用,将做好这一轮AI发展浪潮的准备。此外,丁磊认为,全世界游戏玩家对趣味性要求是一致的,蛋仔派对在中国取得成功后,也会把经验应用到海外市场中,积极探索,逐步验证想法。
人工智能价值对齐初创公司 Synth Labs 获种子轮融资,微软和谷歌前CEO施密特投资
由非营利性人工智能研究组织EleutherAI孵化出的美国新兴初创公司Synth Labs,已从微软旗下风投基金M12和谷歌前CEO施密特(Eric Schmidt)的深度科技风投基金First Spark Ventures处成功筹集了种子轮融资,将用于帮助一系列公司确保其AI系统按照人类的意图来运作。
华为等北京 24 家企事业单位联合发起“大模型应用产业联合体”
2 月 29 日下午,在中关村论坛系列活动【第二届北京人工智能产业创新发展大会】大会上,华为、智谱 AI、百川智能、中国科学院自动化研究所、中软国际、首都在线、第四范式、格灵深瞳、中科创达、软通动力等北京 24 家企事业单位联合发起“大模型应用产业联合体”。
微软开始推出 3 月的 Windows 11 更新,改进了 Copilot、Widget 等功能
微软开始推出 Windows 11 的新更新,其中包括大量改进和新的内置功能。作为此更新的一部分,Windows 11 中的 Copilot 获得了更多控制 PC 的选项,此外还有照片中新的生成擦除选项、用于辅助功能的语音快捷方式、改进的 Snap 布局、对小部件系统的更改等等。
2024年2月29日·周四
人形机器人初创公司 Figure AI 正式宣布 获 6.75 亿美元 B 轮融资,并与 OpenAI 合作开发下一代人形机器人 AI 模型
人形机器人初创公司 Figure AI 今日宣布从 Jeff Bezos、Nvidia、亚马逊、微软和 OpenAI 等投资者那里筹集了 6.75 亿美元的 B 轮融资,估值达 26 亿美元。该公司表示,将利用这笔资金加速其人形机器人的开发,该机器人旨在用于商业用途。此外,Figure AI 和 OpenAI 还达成了一项合作协议,将 OpenAI 的研究与Figure 对机器人硬件和软件的深入了解相结合,开发下一代人形机器人人工智能模型。英特尔的风险基金与 Cathie Wood 的 Ark Invest、Align Ventures 和现有投资者 Parkway Venture Capital 也参与了本轮投资。
上海电影入局AI影视,宣布启动中国动画学派大模型训练
上海电影宣布,将布局AI影视垂直领域,启动中国动画学派大模型训练,加速“超级动画厂牌”内容焕新。上影集团董事长、上影股份董事长王健儿发布了“iNEW新战略”,其中包含启动上影“iPAi(iPAi,即 IP+AI)星球计划”(i)、升级上影网络数智化(Network)、扩张一体化(Expansion)和生态全球化愿景(Worldwide)。
All in AI!魅族公布三大战略:打造AI终端、重构Flyme、建设AI生态
今日晚间,魅族科技在珠海长琴岛举办魅族特别活动,除了将发布魅族首款AI终端魅族21 PRO外,还公布了All in AI战略。据了解,魅族将从三个方面展开All in AI的战略,魅族将打造全新的AI Device,通过产品形态AI原生设计、硬件算力AI全局调用等,为用户带来更加智能、便捷、创新的AI产品体验。
网易 2023 年财报:营收 1035 亿,自研 AI 渗透核心业务跑出新动能
网易发布2023年第四季度及全年财报,总营收1035亿元;非公认会计准则下,归属于公司股东的持续经营净利润326亿元。网易聚焦主业,持续加码技术自研,年研发投入165亿元创新高,以16%研发强度领先行业。目前,网易生成式AI等关键自研技术已全面渗透游戏、音乐、教育等核心业务工作流程,大幅提升数字生产力,辅助突破多个内容垂类赛道,为长期发展注入鲜活动能。
英特尔透露“10X moonshot”计划:打造由 Cobots 驱动的全 AI 自动化芯片代工厂
英特尔在 IFS Direct Connect 大会上的一次闭门活动上,宣布目标 2027 年年底前投产 Intel 10A 工艺之外,还介绍了配备“Cobots”的全人工智能自动化芯片制造工厂。英特尔表示,计划在未来所有代工厂中推广和部署人工智能,从生产流程、产能规划、预测、产量改进到车间级生产操作,都将由人工智能和“Cobots”来完成。
IBM 发布全新 AI SSD:60 秒内检测并清除勒索软件
IBM 公司近日发布新闻稿,宣布推出新版 FlashCore Module 存储硬盘和新版 Storage Defender 软件,两者结合可提高客户检测和应对网络攻击或勒索软件的能力。最新推出的 FlashCore Module 4(FCM)通过引入全新的 AI 模型,可持续监控从每个 I / O 收集到的统计数据,以查找异常情况,如勒索软件开始加密数据。
搭载英伟达 H200 的广达 AI 服务器预计 Q3 量产
英伟达最新高端H200芯片将于第二季开始出货,四大云端服务供应商积极争抢,以因应庞大的AI运算需求,Google主力代工厂广达首批搭载该款AI芯片的AI服务器已开案,预计第三季完成后段测试并量产。广达不评论单一客户订单动态。供应链透露,广达此次量产的H200芯片AI服务器,订单量至少数百机柜起跳,出货单价是一般传统服务器机柜的三至四倍。
美国 SEC 据悉正调查 OpenAI 首席执行官奥特曼的内部通信
据华尔街日报消息,知情人士透露,美国证券交易委员会(SEC)正在审查OpenAI首席执行官山姆·奥特曼的内部通信,作为调查该公司投资者是否被误导的一部分。该监管机构一直在向OpenAI的现任和前任官员及董事索取内部记录,并于12月向OpenAI发出了传票。此前,OpenAI董事会于11月决定解雇奥特曼,并将其赶出董事会。当时,董事们称奥特曼“在沟通中不够坦诚”,但没有详细说明。
奇安信发布《2024人工智能安全报告》:AI深度伪造欺诈激增30倍
奇安信集团对外发布《2024人工智能安全报告》(以下简称《报告》)。《报告》认为,人工智能技术的恶意使用将快速增长,在政治安全、网络安全、物理安全和军事安全等方面构成严重威胁。《报告》揭示了基于AI的12种重要威胁,同时给予应对建议。根据《报告》,2023年基于AI的深度伪造欺诈暴增了3000%,基于AI的钓鱼邮件增长了1000%;目前已发现有多个有国家背景的APT组织,利用AI实施了十余起网络攻击事件
Adobe 推出生成式 AI 音乐原型工具 Project Music GenAI Control
周三在布鲁克林举行的 Hot Pod 峰会上,Adobe 宣布了新的生成式 AI 实验项目:Project Music GenAI Control,一款新的原型工具,允许用户使用文本提示生成音乐,然后编辑音频,而无需跳转到专用编辑软件。
国家自然科学基金委员会发布2023年度“中国科学十大进展”
今天(2月29日)上午,国家自然科学基金委员会发布了2023年度“中国科学十大进展”,主要分布在生命科学和医学、人工智能、量子、天文、化学能源等科学领域。分别为:人工智能大模型为精准天气预报带来新突破、揭示人类基因组暗物质驱动衰老的机制、发现大脑“有形”生物钟的存在及其节律调控机制、农作物耐盐碱机制解析及应用、新方法实现单碱基到超大片段DNA精准操纵、揭示人类细胞DNA复制起始新机制、“拉索”发现史上最亮伽马暴的极窄喷流和十万亿电子伏特光子、玻色编码纠错延长量子比特寿命、揭示光感受调节血糖代谢机制、发现锂硫电池界面电荷存储聚集反应新机制。
Meta 计划 7 月发布 Llama 3,能力接近 GPT-4,最高 1400 亿参数
科技媒体 The Information 援引知情人士报道,Meta计划在今年7月份发布Llama 3大模型。报道称,Meta希望Llama 3能够比肩OpenAI的GPT-4,后者已经成为一个强大的多模态模型,不仅能够处理更长的文本,还支持图像输入。但Meta的一位员工透露,由于研究人员尚未开始对模型进行微调,因此公司尚未决定Llama 3是否是多模态的。Meta员工还说,Llama 3最高可能拥有超过1400亿个参数,相比之下,去年7月发布的Llama 2的参数最高为700亿。另外,在推出Llama 3之前,Meta还在尝试克服Llama 2中发现的一个问题——无法处理任何有争议的问题。
工信部:发布国内首个个人信息保护 AI 大模型“智御”助手
据工信部网站消息,工信部发布国内首个个人信息保护AI大模型“智御”助手,为APP开发运营、检测防护、政策解读等提供智能化服务。着力整治“摇一摇”乱跳转等突出问题,公开通报81款违规APP和SDK,持续净化移动互联网服务环境。
李彦宏:百度文心大模型推理成本已降至1%,与三星、荣耀等达成合作
在百度2023年第四季度及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度文心大模型推理成本已降至1%。李彦宏表示,自发布以来,百度不断降低文心大模型的推理成本,“文心一言”3.5版本的推理成本是3.0版本的1%。李彦宏还表示,文心大模型的日调用量已超过5000万次,季度环比增长190%;去年12月,约有2.6万家企业调用文心大模型,季度环比增长150%。目前,三星、荣耀、汽车之家等知名企业均与百度达成合作。
多家新闻机构起诉微软和 OpenAI,指控 ChatGPT 侵犯版权
科技巨头微软及其生成式人工智能合作伙伴 OpenAI 正因旗下聊天机器人 ChatGPT 和 Copilot 的使用而面临更多诉讼。据 The Verge 报道,三家美国新闻网站 ——Raw Story、The Intercept 和 AlterNet,分别对这两家公司提起诉讼,指控其聊天机器人抄袭新闻网站文章用于训练。
库克:苹果将在生成式人工智能领域“开辟新天地”
苹果今日召开年度股东大会,会上,苹果 CEO 蒂姆・库克(Tim Cook)再次谈及了苹果的人工智能 (AI) 计划。库克表示,公司将在 2024 年在生成式人工智能领域“开辟新天地(break new ground)”,他强调:“我们相信这将为用户带来变革性的机遇。”
阿布扎比主权基金:今年将大规模投资AI和太空技术领域
阿联酋阿布扎比主权财富基金——穆巴达拉投资公司首席执行官穆巴拉克(Khaldoon Mubarak)表示,公司今年将向人工智能(AI)和太空技术领域投入大量资金,推动全球科技的发展。
2024年2月28日·周三
百度 2023 年净利润大涨 39% 至 287 亿元,AI 成增长新动力
百度发布 2023 年第四季度及全年财报,2023 年全年营收 1345.98 亿元,净利润 287 亿元,同比增长 39%;第四季度营收 349.51 亿元,净利润 77.55 亿元,同比增长 44%。百度创始人、董事长兼 CEO 李彦宏表示:“2023年,我们在迭代文心大模型与文心一言、重构产品和服务以及商业化方面取得重大进展。同时,百度核心业务保持韧性和健康发展。展望未来,我们将继续坚定对生成式AI和基础模型的投入,为创造新增长引擎奠定基础。”
扎克伯格“韩国行”首站成果:与LG电子联手,加速XR业务合作
Meta CEO马克·扎克伯格周二(2月27日)会见了LG电子的高层,双方讨论了在扩展现实(XR)设备领域加强合作。LG电子构想,将Meta平台与LG电子电视业务相结合,能够在XR领域形成独特的生态系统。双方还讨论了在人工智能设备上进行合作的可能性。
字节跳动正秘密研发多模态数字人等多个 AI 产品
界面新闻从多个知情人士处获悉,字节跳动正在AI大模型领域秘密研发多个产品,其中包括多模态数字人产品以及AI生图、AI生视频产品等。据一位知情人士透露,其在去年下半年见到了字节跳动多模态数字人产品的demo,整体感觉还不错。另据界面新闻了解,字节跳动旗下剪映已在数月前组建封闭团队,秘密研发AI产品。目前,该团队仍处于严格保密阶段,研发的产品还未上线。
谷歌CEO内部信:AI大模型翻车“不可接受”,将全面纠正错误
在上周谷歌Gemini人物图片生成功能逆天“翻车”后,谷歌CEO首次进行了回应,称其“完全不可接受”。谷歌CEO在内部信中写道,谷歌的AI团队正在昼夜不停地纠正问题,并且已经取得进展。他强调,公司将对Gemini进行结构性改革,以防止类似事件的发生。
三星 AI 手机 Galaxy S24 系列在韩销售破 100 万部
三星电子公布的数据显示,其最新发布的Galaxy S24系列手机在韩国开售仅28天销量便突破100万部,刷新S系列手机销量最快破百万纪录。Galaxy AI是三星手机在2024年最重要的一张牌。该公司也于昨日在中国市场举行了一场产品沟通会,详细介绍了该系列新机具备的AI功能。其主要包含三大方向:翻译、搜索和影像。
英特尔设目标:2025 年全球 AI PC 超 1 亿台,占比 20%
英特尔公司高管在 MWC 2024 上接受采访时表示,科技行业正寻求下一个增长动力,英特尔的目标是到 2025 年,为超过 1 亿台 AI PC 供应处理器。英特尔客户端计算事业部副总裁兼客户端细分市场部总经理冯大为在采访中表示,该公司预估今年将交付 4000 万台 AI PC,明年将再交付 6000 万台,并计划到 2025 年年底,AI PC 在全球 PC 市场中的占比超过 20% 以上。
人形机器人 Ameca 再进化,会看会分辨还能模仿秀
人形机器人 Ameca 展示了视觉感知能力与声音克隆能力:学会“睁眼看懂世界”,还来了段名人模仿秀。表情是 Ameca 的一大特点,她会在回答时直视对方,会歪头端详,会垂眼思考,还会微笑。她已接入GPT-3/4、Stable Diffusion,熟练掌握语言对话能力、绘画能力。
外媒 Bloomberg 抢先实测 Sora 生成视频:不懂物理/动物变形/速度巨慢
Sora 颠覆影视业,现在来看还远。Bloomberg 记者亲自试用后发现,Sora 生成的视频还是翻车严重。而且,它的速度太太太太慢了!Bloomberg 认为:Sora 的确令人印象深刻,但它尚未准备好迎接未来的黄金时段。原因就在于,Sora 现在对于身体部位的理解和物理学的复杂原理还无法完全掌握,并且,它处理请求的时间,实在是太长了!
特斯拉手机应用上线 AI 聊天助手 Beta 版
特斯拉在其手机应用软件中新增了一个人工智能聊天助手功能。据了解,这个AI助手名为“特斯拉助手Beta版”,可用于回答用户关于特斯拉现有产品或其他特斯拉产品的问题。此次更新是特斯拉在提升用户体验方面的又一重要举措。从Beta版的命名来看,这个AI助手刚刚启用,尚不成熟。
AI 视频生成工具 Pika 上线人物配音口型同步功能 LipSync
AI 视频生成平台 Pika 宣布推出为生成视频中的人物对白配音和“对口型”的唇形同步功能 LipSync,目前仅支持 Pro 用户体验。文字生成语音部分由 AI 语音克隆初创公司 ElevenLabs 提供技术支持。不过,目前来看实测效果与 Heygen 和出门问问的奇妙元相比,还有一定的距离。
英伟达 CEO 黄仁勋寄语:学习编程价值大幅降低,生成式 AI 让人人都是程序员
英伟达 CEO 黄仁勋在对孩子的最新寄语中,认为生成式 AI 的未来发展大幅降低了学习编程的意义,人类应该专注于更重要的技能,如生物学、教育学、制造业或农业。黄仁勋表示:“我们的工作就是创造计算技术,让所有人都不需要编程。而且编程语言可以普及成为人类的语言,现在世界上每个人都是程序员。这就是人工智能的奇迹。”
AI 室内设计初创公司 Collov AI 获 1000 万美元 A 轮融资,由金牌橱柜领投
AI 室内设计初创公司 Collov AI 宣布已成功筹集 1000 万美元 A 轮融资,由家居橱柜上市公司金牌橱柜领投。其 AI 橱柜设计工具已在亚洲 3000 多家金牌橱柜商店中使用,并且该品牌的 TikTok 直播超过数百万次展示。
李想谈苹果放弃造车转向人工智能:绝对正确的战略选择
理想汽车CEO李想发文称,苹果放弃造车,选择聚焦人工智能是绝对正确的战略选择,时间点也合适。人工智能会成为所有设备、服务、应用、交易的最顶层入口,苹果的必争之战。李想表示,“做成了汽车,大获成功,苹果会增加2万亿美金的市值,但是汽车大获成功的必要条件仍然是人工智能。汽车的电动化是上半场,人工智能才是决赛。”
蚂蚁百灵大模型推出 20 亿参数遥感模型 Skysense
蚂蚁集团推出 20 亿参数多模态遥感基础模型 SkySense,这是蚂蚁百灵大模型在多模态领域最新的研发成果,其论文已被世界计算机视觉顶会 CVPR 2024 接收。数据显示,SkySense 在 17 项测试场景中指标均超过国际同类产品,这也是迄今为止国际上参数规模最大、覆盖任务最全、识别精度最高的多模态遥感基础模型。SkySense 可用于地貌、农作物观测和解译等,有效辅助农业生产和经营。
马斯克回应苹果取消造车计划,感叹造车之难:破产是汽车公司的常态
报道称,苹果已决定放弃长达十年的电动汽车研发计划,这意味着该公司历史上最雄心勃勃的项目之一走向终结。特斯拉CEO埃隆·马斯克在社交媒体上回复了一位网友分享的这条消息,用了两个表情符号:敬礼和抽烟。美国只有两家大型汽车制造商没有破产过:特斯拉和福特。”马斯克回应称:“一家汽车公司的自然状态是死亡。”
美参议员呼吁:限制三大科技巨头(微软、谷歌、亚马逊)开发大语言模型
美东时间周二,美国马萨诸塞州民主党参议员伊丽莎白·沃伦(Elizabeth Warren)发出反垄断呼吁,要求禁止亚马逊、微软和谷歌这三大科技巨头开发大语言模型(LLM)人工智能技术,并呼吁亚马逊和谷歌将业务分拆。
苹果取消电动汽车项目,背后2000人团队转岗做AI
据外媒报道,援引内部消息人士透露,苹果公司已搁置并取消了自动驾驶电动汽车的所有开发计划。苹果汽车项目启动已有十多年时间,期间投入了数十亿美元,但最终决定这不是一个可行的项目。知情人士表示,苹果于美国当地时间周二向内部员工披露了上述决定,令参与该项目的近2000名员工倍感震惊。该项目将开始逐步缩减规模,而汽车团队(即特殊项目团队,简称SPG)的众多成员将被调往人工智能部门,由高管约翰·詹南德里亚(John Giannandrea)领导。这些员工将专注于推动生成式人工智能项目,这已成为苹果日益重要的战略重心。
消息称谷歌与部分出版商达成合作,使用生成式 AI 工具创作新闻内容
据 Adweek 报道,谷歌正悄然与部分出版商达成协议,使用新的生成式人工智能 (AI) 工具创作新闻内容。这些合作协议据称每年价值数万美元,似乎是谷歌新闻倡议 (GNI) 的一部分。GNI 是一项为期六年的计划,为新闻机构提供媒体素养项目、事实核查工具和其他资源。然而,此举涉及生成式 AI 内容创作,可能会引发争议。
OpenAI 称《纽约时报》“入侵”了 ChatGPT,人为制造版权诉讼
据路透社、Ars Technica 报道,OpenAI 要求美联邦法官驳回《纽约时报》对其提起的部分版权诉讼,因为纽约时报“黑入”了聊天机器人 ChatGPT 等 AI 系统,为此前的诉讼生成了“具有误导性”的证据。OpenAI 称纽约时报花钱请人破解了 OpenAI 的产品。
GitHub 上线面向企业的 AI 编程助手 Copilot Enterprise
开源软件开发和托管平台 GitHub 今天推出了一款新产品,旨在帮助大型企业在其编程项目中利用人工智能的力量。该产品名为 GitHub Copilot Enterprise,是一款 AI 编程助手,可以根据企业自己内部的代码库和标准生成代码建议、回答查询并总结更改。
2024年2月27日·周二
英伟达对华“特供”H20芯片今年GTC后全面接受预订,最快四周供货
《科创板日报》记者从产业链人士处了解到,英伟达对华“特供版”AI芯片H20将在今年的英伟达GTC 2024大会(3月18日-3月21日)开完之后,全面接受预订,最快四周可以供货。一名产业链人士表示,H20的性能相当于H100的四分之一,但性价比不太好,产能供应也跟不上,量供预计要到今年下半年。
全国首创:南京大学开设人工智能通识核心课程体系,面向全体本科新生
据南京大学官方微信公众号,南京大学今日召开新学期工作布置会,会上发布了 2024 年 9 月面向全体本科新生开设的“人工智能通识核心课程体系”总体方案,官方称这是全国高校首创,在高校中首开先河。
谷歌发布AI基础世界模型Genie,一张图可生成一个交互式世界
日前,谷歌研究人员发布了110亿参数的全新AI模型,仅用一张图片,便可生成一个交互式世界,生成的世界“动作可控”,用户可以在其中逐帧行动。谷歌将该模型定义为“生成式AI的一种新模式”,并命名为Genie(全称generative interactive environments,生成式交互环境,Genie一词中文意为“精灵”)。谷歌宣称,Genie开启了“图/文生成交互世界”的时代,还将成为实现通用AI Agent的催化剂。
AI 芯片供应问题缓解,消息称部分公司开始转售英伟达 H100 GPU
据报道,用于人工智能 (AI) 和高性能计算 (HPC) 应用的英伟达 H100 GPU 交货周期大幅缩短,从之前的 8-11 个月缩减至仅 3-4 个月。这导致一些囤货的公司正在试图出售其过剩的 H100 80GB 处理器,因为现在从亚马逊云服务、谷歌云和微软 Azure 等大型公司租用芯片更加方便。
12家创业公司+4家大厂全景图:谁会成为中国版Sora?
国内有哪些团队、哪些人才正在从事 AI 视频行业?「甲子光年」基于公开资料与现有信息,整理了国内 12 家创业公司与 4 家大厂的 AI 视频团队信息。这些信息不仅给产品爱好者较为全面的 AI 生成视频模型总结,也给更多的关注人工智能技术走向的 AI 从业者们一份技术与人才指南。
Groq CEO:大部分AI创业公司将在2024年前使用速度更快的LPU
总部位于硅谷的Groq正在为大语言模型推理(对现有模型做出决策或预测,而不是训练)开发新的AI芯片(LPU)。Groq创始人兼CEO Jonathan Ross近日在接受采访时,展示了Groq提供动力支持的音频聊天机器人,其响应速度打破了记录。Ross表示,AI推理的成本高昂,他的公司因此专门为大模型提供了“超快”、更便宜的芯片选择。Ross宣称:“到今年年底,我们很可能会成为大多数初创公司使用的基础设施,我们的价格对初创公司非常友好。”
“木头姐”回应抛售英伟达:收益已超150倍,继续获利了结
在人工智能热潮加剧,英伟达的出色财报推动全球股市创新高之际,伍德却在逆势减持全球芯片龙头公司的股票。凯茜·伍德的方舟投资管理公司周一继续抛售英伟达股票,通过旗下方舟基因组革命ETF(ARKG)卖出了2724股,价值约215万美元。伍德回应了一篇质疑ARK为何出售英伟达的帖子。她写道:“根据我们的AI研究,ARK在2014年就以大约5美元的价格买入了英伟达,当时大多数投资者都将其视为一家PC游戏芯片公司。在涨幅超过150倍之后,我们正继续套现利润。”
荣耀CEO赵明:AI手机≠生成式AI手机,将全力打造欧洲“第二本土市场”
荣耀CEO赵明日前在西班牙巴塞罗那 2024 MWC 上表示:“其实很多厂商对于AI手机的概念存在误解,能够提供生成式AI能力的手机并不等于AI手机,甚至相去甚远,真正的AI手机是可以发展、进化的,它搭载的是个人化的操作系统,它真正懂用户,而且每个人的AI手机都能提供千人千面的不同体验。”赵明公开提出,荣耀强调要全力将欧洲打造成“第二本土市场”。
51Sim获5000万元A轮融资,聚焦自动驾驶仿真与合成数据
近日国内数据仿真平台公司51Sim完成了5000万元A轮融资。本轮融资由北汽产投、普耀九州、益富海股权及巨田资产等共同投资。对于本轮融资,51Sim表示将用于技术研发 ,持续聚焦数据驱动仿真闭环、合成数据、交通信息模型平台等。51Sim成立于2017年,由数字孪生公司51WORLD孵化,专注于数据闭环与仿真平台业务。
研究:近一半热门新闻网站屏蔽了 OpenAI 爬虫
一项由路透社研究所进行的研究表明,截至 2023 年底,全球 10 个国家的热门新闻网站中,近一半 (48%) 屏蔽了 OpenAI 的爬虫(Crawler),而近四分之一 (24%) 屏蔽了谷歌的 AI 爬虫。
摩根大通 CEO:人工智能不是炒作,是真正的革命
摩根大通首席执行官杰米·戴蒙(Jamie Dimon)在采访中表示,人工智能不仅仅是一时的潮流,它拥有深远的潜力。他提到了21世纪初的互联网泡沫,并将其与目前的情况相比较,称当初投资者的兴奋似乎超过了实际的热度。而对于此次由人工智能引发的变革,戴蒙称,“这不是炒作。这是真的。人们正在以不同的速度部署它,用它来处理大量的事情。”他也指出,人工智能最终将“几乎用于所有工作”。
GoDaddy 推出 AI 套件 Airo,可生成域名建议、Logo、网站和社交帖子等
域名注册服务 GoDaddy 宣布推出 Airo,一种面向小型企业的 AI 数字营销解决方案。输入简单的业务描述后,Airo 便可以生成域名和附加内容,包括 Logo 设计、完整构建的网站和专业的电子邮件帐户。此外,通过上传产品照片,Airo 还可以自动生成自定义产品描述。
谷歌将生成式 AI 功能集成到 Messages、地图、Android Auto 等中
Google 在巴塞罗那 举行的 2024 年世界移动大会上宣布将在 Android 智能手机和可穿戴设备上推出新一轮的生成式人工智能功能。这些更新包括消息应用程序的人工智能增强、Android Auto 的新功能、通过 Wear OS 智能手表访问机票和登机牌的能力等等。谷歌表示,用户可以直接在任何 Android 手机的消息应用程序中访问其最先进的生成式人工智能模型 Gemini。
国资委:加快人工智能等新技术赋能,打造一批有竞争力的平台和企业
据国资委网站消息,2月26日,国务院国资委党委召开扩大会议。会议强调,要加快转型升级,发挥枢纽联接作用,助力推进多式联运,加快人工智能等新技术赋能,打造一批有竞争力的平台和企业,提升服务实体产业的能力效率;要推动中央企业加强供应链协同合作、信息共享,降低工业物流综合成本,带动上下游企业降本增效。
谷歌:希望未来数周内重新上线 Gemini 模型人像生成功能,正在修复问题
据路透社报道,当地时间 26 日,谷歌 DeepMind 首席执行官德米斯・哈萨比斯在 MWC 2024 的小组讨论会中表示,“我们已下线 Gemini 的人像生成功能,同时正在修复问题,希望未来几周内重新上线。”
微软 Copilot 推出多个定制 GPT 模型,包括健身教练、度假计划师等
近日,微软推出了升级版的 AI 伴侣 Copilot ,其中新增了一项定制的 GPT 功能 ——“健身教练(Fitness trainer)”,可以帮助用户解答健身方面的问题。这一消息由 Copilot 负责人 Jordi Ribas 通过社交媒体平台 X 发布。Jordi 分享了一段动画展示了 Copilot 的新功能,除了帮助健身的 GPT 模型,动画中还展示了设计师、度假计划师和食谱生成器等其他功能。
微软发布全新人工智能访问原则,公司迄今最大规模投资计划
在 2024 年世界移动通信大会上,微软总裁布拉德・史密斯(Brad Smith)宣布了公司全新的人工智能访问原则 (AI Access Principles),这一原则将指导微软未来拓展人工智能领域的业务发展。“我们今天宣布的原则,是微软公司 49 年历史上最大规模的投资、合作伙伴关系和促进创新和竞争的计划。通过发布这些原则,我们致力于提供广泛的技术访问权限,使世界各地的组织和个人能够以服务公众利益的方式开发和使用人工智能。”
五角大楼证实:美军在中东空袭中大规模使用AI技术
在本月对中东多国的空袭中,美军使用了人工智能(AI)技术来帮助识别打击目标。人工智能系统还帮助识别了也门胡塞武装的火箭发射器和红海的水面舰艇。
2024年2月26日·周一
微软据悉与法国人工智能初创企业 Mistral 合作,帮助后者将人工智能模型推向市场
微软与法国人工智能初创企业Mistral达成了一项协议。微软将为这家成立10个月的公司提供帮助,帮助其将人工智能模型推向市场。微软还将持有Mistral的少量股份,但财务细节尚未披露。此次合作使Mistral成为第二家在微软Azure云计算平台上提供商业语言模型的公司。去年12月,Mistral在一轮价值约4亿欧元的融资中获得了20亿欧元的估值。
英伟达发布全新RTX 500和1000 GPU芯片,AIGC性能提高1400%
AI 芯片巨头英伟达(NVIDIA)宣布推出全新NVIDIA RTX 500 和 1000 Ada一代消费级GPU(图形处理器)加速芯片,全面支持在轻薄笔记本电脑等移动设备中运行生成式AI(AIGC)软件。英伟达表示,与仅使用CPU的配置相比,全新RTX 500 GPU可为Stable Diffusion等模型提供高达14倍(1400%)的生成式 AI 性能,利用 AI 进行照片编辑的速度提高3倍,3D渲染的图形性能提高10倍,从而成功实现了生产力的巨大提升。作为入门款GPU产品,英伟达RTX 500将成为全球内置AIGC技术且价格最便宜的GPU芯片。
网友曝光 OpenAI 秘密项目 Feather:简化 AI 应用开发
2月26日消息,有网友在「X」上发布了OpenAI Feather 的应用页面。虽然目前 https://feather.openai.com 还无法登入使用,但一些可以查看的基本信息显示出 OpenAI 可能正在为Feather的正式发布做准备。Reddit 上有用户称,这个服务至少从去年12月就开始存在。该站点需要单点登录(SSO),所以这一服务可能是为向单个关键合作伙伴或少数合作伙伴和战略客户提供定制解决方案、独家服务而推出的,同时,它也可能用于在内部标记数据集以进行微调服务。
三星智能戒指 Galaxy Ring 亮相 2024 年世界移动通信大会(MWC)
韩国科技巨头三星电子最新推出的智能戒指Galaxy Ring首次亮相2024年世界移动通信大会(MWC)。三星电子数字健康团队负责人Hon Pak在一次采访中讨论了这款产品,称这是该公司首次进军戒指产品类别。他指出,Galaxy Ring将推出健康追踪功能,包括心率和睡眠监测,同时还会给用户一天的身心情况打分。三星高管指出,未来这款产品中将会融入人工智能。
蔡崇信称电商是最丰富的AI应用场景,创始人成为公司大股东对提振信心十分重要
阿里巴巴集团董事长蔡崇信表示,阿里巴巴将聚焦电商和云。电商是最丰富的AI应用场景,阿里正在加大对相关技术的投资,例如正在努力通过更精准的供需匹配,提升用户购买频次和订单量。12月季度,淘宝天猫平台上的订单量成功实现了两位数增长。谈及马云和蔡崇信成为阿里最大的个人股东,蔡崇信说,企业创始人成为重要股东,展示了对公司的信心,这是一个非常重要的信号。
谷歌 Gemini 模型明年或登陆安卓手机 据谷歌方面透露,预计明年将在安卓系统手机嵌入 Gemini 模型
目前,谷歌已经在Pixel智能手机以及其它条件合适的安卓设备上提供了Gemini Nano的服务,但只能通过互联网连接远程数据中心进行访问。谷歌Pixel部门产品管理副总裁Brian Rakowski表示,Gemini Nano有望在明年直接登陆智能手机,且该模型有更小的版本,谷歌在压缩模型以适配手机运行方面已经取得了不小的突破。
高通推出全新 AI Hub,助力 AI 推理速度最高提升 4 倍
高通在今天的 MWC 发布活动中正式推出了全新的高通 AI Hub,为开发者打造获取开发资源的中心,从而可以基于骁龙或高通平台打造 AI 应用。具体来说,高通 AI Hub 可以为开发者提供全面优化的 AI 模型库,包括传统 AI 模型和生成式 AI 模型,能够支持在骁龙和高通平台上进行部署。
英伟达、三星、ARM、微软等 11 家公司成立 AI-RAN 联盟
AI-RAN 联盟今日在巴塞罗那 MWC2024 成立,该组织旨在通过与相关公司合作,将人工智能和无线通信技术相结合,并引领技术创新。据悉,该组织共有 11 个初始成员,包括三星、ARM、爱立信、微软、诺基亚、英伟达、软银等半导体、电信、软件巨头。这一新的联盟将合作开发创新的新技术,以及将这些技术应用到商业产品中,为即将到来的 6G 时代做好准备。
猎聘大数据:2024 年开工首周 AIGC 相关岗位同比增长 6 倍
猎聘大数据研究院发布的报告显示,随着Sora横空出世,AIGC相关岗位激增,同比增长6倍。其新发职位较去年开工首周增长了612.5%,招聘平均年薪也较为可观,为44.37万元。从AIGC相关职位的职能分布TOP5来看,算法工程师、产品经理位居前二,占比为18.95%、12.63%。视觉设计、自然语言处理、图像算法位居第三至第五。
国内首部文生视频 AI 动画片《千秋诗颂》今晚在央视开播
由中央广播电视总台制作的中国首部文生视频 AI 动画片《千秋诗颂》,将于 2 月 26 日起在总台央视综合频道 (CCTV-1) 18:40 档开播。首批推出的《春夜喜雨》《咏鹅》等 6 集动画片通过 AI 人工智能技术呈现独具中国审美特色的美术视觉,展现中华经典诗词中的家国情怀和人间真情。
韩国人工智能芯片初创公司 DeepX 据悉接近获得 9000 万美元融资
据知情人士透露,人工智能芯片初创公司DeepX即将在一轮融资中筹集1200亿韩元(约合9000万美元),用于加速生产和全球扩张。这家韩国公司已从Skylake Equity Partners公司筹集了600亿韩元,并从现有支持者Timefolio Asset Management公司筹集了300亿韩元。DeepX还在与另一家投资者进行最后的商谈,争取在下个月之前获得300亿韩元的资金。
ChatGPT 测试用于 Android 移动端的主屏幕小部件
据 TheVerge 报道,ChatGPT 推出了适用于 Android 平台的主屏幕小部件。据 Android 专家 Mishaal Rahman 表示,新推出的小部件功能可以让用户更快地访问 OpenAI 聊天机器人的对话和查询模式。用户可以在正式推出该功能够点击并按住 Android 手机主屏幕上的空白位置以调出小部件菜单。Mishaal Rahman 表示,该功能目前应该还在测试,合适推出尚不确定。
联想展示下一代 AI PC 概念机:无边框全透明屏电脑
联想集团携全景式AI终端、基础设施和解决方案组合亮相MWC,并展示两款挑战传统个人电脑和智能手机外形的新概念产品,即ThinkBook透明屏笔记本电脑和自适应的摩托罗拉智能手机。利用AIGC技术,透明屏幕为工作协作和提高效率开辟了新途径,能够将物理对象与数字信息相结合,创造出独特的用户内容,让设备能够自然融入周围环境。用户可无缝在键盘与绘图板之间切换,利用手写笔进行创作。
NPU 加持,微软画图应用有望迎来全新 AI 功能
过去几个月,微软画图应用(Paint)一直在不断更新功能,其中包括由 DALL-E 3 驱动的“共创”功能和移除背景图像功能。最近,微软甚至为画图添加了类似 Photoshop 的图层功能。现在运行于 Windows 11 系统的画图又将迎来一项全新的 AI 功能,该功能可能依赖于 NPU 运行。推测认为,微软画图可能正在整合需要 NPU 功能的 AI 特性,例如利用 AI 算法直接在设备上进行高级图像编辑工具或实时效果。当然,也不排除微软正在开发其他功能的可能性。
多模态大模型初创公司 Weitu AI 完成天使轮融资,估值一亿美金
多模态大模型初创公司香港 Weitu AI 公司完成了天使轮融资,天使轮估值一亿美金。天使轮投资人为拥有全球数亿月活的互联网科技公司和著名天使投资人。据了解,该公司目前刚刚成立,超过半数成员来自北美名校毕业并拥有海外大厂的工作经验。团队成员中包括了数位长期活跃在人工智能多模态领域的研究专家以及拥有大模型基础研发能力的技术专家。
探索可穿戴设备各种可能,古尔曼称苹果正规划带摄像头的 AirPods 及智能戒指
彭博社记者马克・古尔曼(Mark Gurman)在最新一期《Power On》时事通讯中提到,苹果公司正在探索未来可穿戴设备的“各种可能”,包括配备了摄像头的 AirPods 耳机、智能眼镜、智能戒指等。
荣耀在 2024 MWC 世界移动通信大会发布 AI PC 和 AI 使能的全场景战略
荣耀在2024 MWC世界移动通信大会上正式发布了全新的AI使能的全场景战略,推出平台级AI赋能,以人为中心的跨操作系统体验和基于意图识别的全新人机交互。此外,荣耀也发布了荣耀 Magic6 Pro,AI PC 荣耀 MagicBook Pro 16 等一系列智能设备。从手机到 PC,我们可以看到荣耀在大模型技术落地应用的思考。
2024年2月25日·周日
英伟达CEO黄仁勋最新专访:点赞华为,回应是否担心中美在AI领域竞争
黄仁勋承认自己每天醒来,都仿佛是在创业的第一天,因为英伟达始终在探索未知的领域,有失败的可能性。他透露,英伟达正努力将所谓的AI工厂转化为实际产品,这是一种全新形态的数据中心。黄仁勋称,英伟达正在基础机器人技术领域取得突破性进展,类人机器人的到来或许已指日可待。黄仁勋提及,英伟达今年将推出新一代图形处理器Blackwell,其性能打破了记录。当被问及美国芯片出口限制是否会刺激中国推出更有竞争力的AI芯片时,黄仁勋称中国有很多竞争力很强的东西。
周鸿祎:和Sora的差距一两年就能赶上,企业首先要建立AI信仰
周鸿祎在接受澎湃新闻记者采访时提到,AI不会带来行业崩溃,而是会给短视频、影视工业、广告等行业带来正向推动,只有不用AI的人会被淘汰。AI恐惧论和AI万能论,两种思维都是不可取的。周鸿祎提到,无论是Sora采用的Transformer模型还是Sora本身,本质都是软件,“现在的落后,我觉得大概一到两年就能解决。”周鸿祎表示,现在企业对AI普遍都比较向往,但不知道从何切入,特别是非AI企业和AI距离还比较远。企业应该首先建立AI信仰,要往“All in AI”的方向走。
三星将在 MWC 2024 公开展示智能戒指 Galaxy Ring
今日三星电子发布新闻稿称,在西班牙巴塞罗那举行的 2024 年世界移动通信大会(MWC)上,三星电子将通过 Galaxy AI 带来全新的移动体验。三星展台的参观者将在所有 Galaxy 产品上亲身体验 Galaxy AI,包括 Galaxy S24 系列。Galaxy AI 还将扩展到整个三星产品组合,包括通过 Galaxy Book4 系列、Galaxy Watch6 系列,以及首次公开展示的 Galaxy Ring。
特斯拉再次展示第二代人形机器人 Optimus 步行能力:更加稳健流畅
特斯拉公司于周六通过其社交媒体账号分享了一段最新视频,展示其正在研发的 Optimus 人形机器人的流畅步行能力。视频展示了该机器人在测试场地内行走,并配有诙谐的标题“完成每日步数目标”。相比几周前发布的视频,此次展示的擎天巨臂似乎是更新或更加完善的版本,其在行走过程中步伐更稳健,动作也更加流畅。
报道:苹果正在内测类 ChatGPT 工具 ASK
据MacRumors报道,苹果为其AppleCare支持顾问开发了一款类似ChatGPT的工具,名为“Ask”,该工具可以自动生成针对客户技术问题的回复。然后,顾问可以通过在线聊天或电话将信息转发给客户。
谷歌 AI 新星转投 Pika:视频生成 Lumiere 一作,担任创始科学家
谷歌研究员Omer Bar-Tal,担任Pika创始科学家。此次加盟Pika前,他曾是谷歌研究院以Student Researcher身份待了9个月,最终经过7个月的研究以共同一作身份推出了Lumiere。这时候硕士应该还没有毕业。Lumiere的创新点在于,提出了时空U-Net(STU-Net)架构:将视频在空间和时间两个维度同时进行下采样和上采样,在网络的中间层得到视频的压缩时空表示。在学习了3000万视频之后,Lumiere可支持文生视频、视频编辑修复、图片转视频以及视频风格化等多种功能。
2024年2月24日·周六
英伟达成立新研究部门 GEAR,打造虚拟与现实世界中的全能智能体
英伟达宣布成立新的研究部门——“ GEAR ”,全称为通用具身智能体研究(Generalist Embodied Agent Research)。这个新部门由AI高级研究科学家、AI代理计划的负责人 Jim Fan 和 Yuke Zhu 教授领导。GEAR的核心使命是构建适用于虚拟与物理世界的具身智能体的基础模型,致力于实现跨多模态、多场景的智能应用。研究团队将专注于四大关键领域:多模态基础模型、 通用型机器人研究、虚拟世界中的基础智能体、模拟与合成数据技术。
由于 Sora 的震撼,知名电影制片人泰勒·派瑞暂停其 8 亿美元的工作室扩张计划
在近日发表的《好莱坞报道》采访中,电影制片人泰勒·派瑞(Tyler Perry)谈到了他对人工智能视频合成对娱乐行业就业影响的担忧。他特别透露,在看到 OpenAI 最近发布的人工智能视频生成器 Sora 的功能后,他已经暂停了计划投资 8 亿美元的制作工作室扩建计划。泰勒列举了仅通过文本提示在科罗拉多州的雪地或月球上进行虚拟拍摄的例子,表示这项技术可能会大幅降低制作电影所需的成本,可能会使娱乐业的就业机会面临危险。
报道称人形机器人初创公司 Figure AI 正筹集 6.75 亿美元融资
据知情人士称,亚马逊创始人贝索斯、英伟达、OpenAI和微软都向一家开发类人机器人的初创公司 Figure AI 提供了投资。Figure AI 据报道在新一轮融资中已经筹集了约 6.75 亿美元,而融资前估值约为20亿美元。正式的投资协议预计将在下周一签署,而具体细节仍可能出现变化。
Humane 智能穿戴设备 AI Pin 延迟交付,将于 4 月中旬发货
Humane 此前发布 AI Pin 时称将于3 月份开始发货,但目前出现了小幅延迟。根据 Humane 员工 Sam Sheffer 的视频更新以及 Humane 官方 Discord 频道中的通知,早期采用者现在被告知订单最早将于 4 月中旬到达。该公司表示,对于 3 月 31 日之前购买的任何客户,将免费提供三个月的每月 24 美元的订阅服务。
出门问问宣布开放“序列猴子”首个开源数据集
出门问问日前宣布,将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集,命名为“序列猴子开源数据集1.0”。本次开源的“序列猴子数据集1.0”包含了中文通用文本语料、古诗今译语料以及文本生成语料。
微软发布 PyRIT 工具,帮专家和工程师识别生成式 AI 模型风险
微软近日发布了开源自动化框架 PyRIT,这是一款 Python 风险识别工具包,主要帮助安全专家和机器学习工程师识别生成式 AI 的风险,阻止他们的人工智能系统失控。
微软 Copilot 聊天机器人开放“笔记本”功能,最高 1.8 万个字符
微软公司副总裁兼 Copilot 和必应工程与产品负责人约尔迪・里巴斯(Jordi Ribas)近日发布推文,宣布网页版 Copilot 聊天机器人正式上线“笔记本”功能,最高支持 18000 个字符。
2024年2月23日·周五
Hugging Face 开源“世界最大”AI 训练合成数据集 Cosmopedia
Hugging Face 近日开源了一款名为“Cosmopedia”的 AI 训练数据集,号称是目前世界上最大的合成数据集。该数据集内容均由 Mixtral 7b 模型汇总生成,其中收录 3000 万以上文本文件,包含大量教科书、博客文章、故事小说、WikiHow 教程等内容,共计 250 亿个 Token。
联想杨元庆:2024年全球PC出货量将同比增涨约5%,AI PC目前是“雷声大、雨点小”
联想集团董事长兼CEO杨元庆称,预期2024年全球的PC市场大概会有5%的同比增长。但上半年和下半年是不一样的,上半年受宏观经济的影响以及上一波疫情期间换机高峰用户还未到换机周期,同时,Windows11的换新大概会到下半年才会发生。同时,杨元庆还称,AI PC的普及会带动AI平民化、普及化,但目前AI PC仍然是“雷声大、雨点小”,应用也还不是很丰富。
谷歌 CEO:AI 能协助防御网络安全威胁
随着人工智能的快速发展,越来越多人担忧黑客可能会利用人工智能工具来加强网络安全攻击。谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,人工智能也可以反过来成为防御者手中的武器,有助于加强抵御网络安全袭击的能力。
Sora等生成式AI消耗大量能源和水,美议员首提法案应对能源危机
Sora连日刷屏引爆全网,然而,生成式人工智能背后,能源和水资源的消耗问题也不容小觑。今年2月1日,美国马萨诸塞州参议员埃德·马基等美国民主党人提出了《2024年人工智能环境影响法案》。该法案希望建立评估人工智能对环境影响的标准,并为人工智能开发者和运营商创建一个自愿报告框架。
OpenAI 更新 GPT 商店:提供评级和扩展构建者资料
OpenAI 在社交平台 X(原 Twitter)上宣布对 GPT 商店进行更新,第三方 GPT 的用户可以使用该机器人对其进行评分。此外,GPT 构建者现在可以在他们的账户资料中包含更多信息,这些资料会在用户点击其名字时显示。这些信息包括添加构建者的LinkedIn页面或个人资料、X账户、网站链接,以及GPT的平均评分、总评分数、“对话”数量(即使用该GPT开始的会话数量)。
来源: VentureBeat
李一舟被曝侵权:名下每月 399 元的付费网站,搬运 AI 创作社区近百模型
日前,国内最大的 AI 模型、AI 创作分享社区 LiblibAI 撰文称,「一舟智能」未经授权就上传了社区的模型、并用作商业化,这损害了公司和模型创作者的权益。经 LiblibAI 团队统计,被搬运的模型共有 97 个:包括北邦的「梦境中国|国风无涯山水」、叶叶叶叶叶的「Zenpainting | 禅意插画」、墨悠的「墨悠人造人」、Arxchibo 的建筑类模型等等。目前 LiblibAI 已诉诸法律手段。
Meta 首席 AI 科学家 LeCun:OpenAI 的视频生成模型 Sora“注定要失败”
OpenAI 新推出的 AI 视频生成模型 Sora 一经发布就成为业界焦点,不过 Meta 首席人工智能科学家 Yann LeCun 却并不认同其价值。LeCun 在 X 平台(原 Twitter)发帖称:“通过生成像素来模拟世界的行为,就像曾经被广泛弃用的‘通过合成进行分析’一样,既浪费资源又注定失败。”
沙特欲凭借能源资源和资金能力优势打造全球 AI 中心
周四,沙特主权财富基金——公共投资基金(PIF)负责人表示,要凭借该国的能源资源和资金优势,将沙特打造为美国以外的全球人工智能中心。他的话表明,打造数据中心可能是沙特国家战略的核心部分。
黄仁勋:英伟达正在为中国市场提供两款新型人工智能芯片样品
英伟达CEO黄仁勋(Jensen Huang)在发布公司2023年第四季度财报后接受路透社采访时透露,英伟达目前正在向客户提供针对中国市场的两款新型AI芯片样品。“我们现在正和客户一起测试,它们(两款新AI芯片)都在没有许可证的情况下遵守了(美国出口管制)规定,我们正等待客户的反馈。
中国首部文生视频AI系列动画片《千秋诗颂》将启播
据央视频消息,中国首部文生视频AI系列动画片《千秋诗颂》启播暨中央广播电视总台人工智能工作室揭牌仪式将在今日举行。据官网介绍,《千秋诗颂》面向小学生,是小学语文课本诗词动画故事系列片,由CCTV-1与人教社合作制作,栏目结合人教社提供的诗词内容及相关背景故事,制作成国风动画诗词故事,在尊重历史的前提下重构故事剧本,以求最大限度再现诗词意境和感情。
Windows 照片应用支持“生成式擦除”功能,消除照片中的干扰
微软今天发布博客文章,向用户分享照片应用的最新编辑功能“生成式擦除”。据介绍,该功能允许用户修复和删除照片中的干扰因素,例如背景物体或各种视觉混乱。生成擦除在擦除照片中的物体后可创建更无缝和更真实的结果,即使在擦除大面积区域时也是如此。
消息称 AMD 将推 HBM3e 版 MI300,明年发布新一代 AI 加速器 MI400
消息人士 @Kepler_L2 透露,AMD 将推出换用 HBM3e 的 AI 加速器 MI300 改版,以低价与竞品英伟达 B100 竞争,而 AMD 下一代 Instinct MI400 加速器将于 2025 年发布。
钉钉叶军:AI技术已经成为开启类似电力革命新时代的分界线
在“2024亚布力中国企业家论坛”上,叶军表示,当前的AI技术已经成为开启类似电力革命这样新时代的分界线,AI可以“+”一切。谈到AI和钉钉这样的协同工具融合将带来何种改变,叶军表示会有三个变化:首先,交互方式会在原先纯粹的GUI基础上增加LUI,交互会变得“所想即所得”;其次,AI会让分解任务的过程智能高效,因为AI了解谁适合干什么、哪个系统适合来做;最后,执行层面会涌现出更多行业小模型和专属模型。
OpenAI CEO 奥特曼将成 Reddit 最大股东之一
美国社交媒体平台Reddit周四提交了IPO申请,相关文件显示,OpenAI首席执行官萨姆·奥特曼成为Reddit的最大股东之一。文件显示,与奥特曼有关联的实体持有Reddit的8.7%的流通股,其中包括789456股A类股和1140万股B类股。2014年,奥特曼领投了Reddit的5000万美元B轮融资,他在一篇博客文章中写道,在此之前的九年里,他每天都在使用Reddit。2021年上半年,Reddit进行了E轮融资,奥特曼又投资了5000万美元。随后,在2021年下半年,奥特曼又向Reddit投资了1000万美元,
AI 人才推荐平台「今日人才」获近亿元 C 轮融资,服务客户包括比亚迪、小米、理想等公司
平台型人力资源科技公司「今日人才」获得由盛景嘉成和凯思博领投的近亿元C轮融资,资金将用于产品研发、平台运营、市场拓展与品牌推广。目前其投后估值近20亿人民币,此前其也曾获得由今日资本领投的亿元级别B轮融资。今日人才成立于2018年,是利用大数据、云计算、AI算法等技术,由泛猎头(B端同行企业)协作完成的中高端人才招聘平台。
Stability AI 发布第三代图像生成模型 Stable Diffusion 3
Stability AI 发布第三代图像生成模型 Stable Diffusion 3 ,新一代模型在文字渲染能力、多主题提示能力和图像质量方面有大幅提升,从官方公布的图片来看,生成效果与Midjourney不相上下,甚至有超越。技术方面,目前,模型可选择的参数范围在800M到8B。详细的技术报告还未公布,官方目前只透露主要结合了扩散型Transformer架构( DiT )以及Flow matching。
Reddit 表示通过向训练 AI 模型公司签订的数据许可协议总价值 2.03 亿美元
在 IPO 招股说明书中,Reddit 反复强调其将从利用该社交平台上超过 10 亿帖文和超过 16 亿评论训练人工智能模型的公司签订的数据许可协议中获益匪浅。招股说明书中写道:“2024 年 1 月,我们签订了某些数据许可协议,合同总价值为 2.03 亿美元,期限为两到三年。”
来源: TechCrunch
基于 Gemini 模型,谷歌 Chrome 浏览器新增“Help Me Write”AI 写作工具
谷歌今天发布新闻稿,宣布自 Chrome 122 浏览器版本开始,邀请 Mac 和 Windows PC 用户体验全新的“Help me write”功能。这项功能使用 Gemini 模型,可以帮助你开始写作或完善你已经写好的内容,例如你可以让其完善销售文案、餐厅评价,或者查询酒店预订信息。
英伟达市值暴涨2770亿美元,等于两个高盛,一个奈飞,分析师:AI派对才开始
周三发布劲爆业绩的英伟达隔日继续猛拉,美股周四收盘涨幅超过16.4%,刷新股价最高纪录,市值猛增2770亿美元,相当于增加了一个整个的Netflix或一个整个的Adobe,或者接近半个摩根大通或两个高盛!分析师称AI派对才开始,英伟达股价最终可能涨至四位数。黄仁勋的身家升至彭博亿万富豪指数的第21位。来源: 华尔街见闻
华为 P50 Pro 手机小艺大模型版开始众测,可体验对话式问答能力
华为 P50 Pro 手机现已开启小艺大模型版众测,版本号为 12.1.1.400,大小为 65MB,日期为 2024/2/20-2024/3/31。据官方介绍,搭载了大模型能力的智慧助手小艺能够完成更复杂的任务。众测期间可体验文案辅助创作能力、资讯快速摘要和对话式问答能力等,可以对小艺说“你可以干什么”,或者根据自身使用习惯 挖掘更多玩法。
2024年2月22日·周四
迪士尼深入 AI 布局,ElevenLabs 等三家 AI 初创公司入选其孵化器计划
迪士尼选择了三家从事人工智能研究的公司作为其年度创业孵化器计划的五家入选公司之一。今年的入选名单包括 AudioShake(使用AI混音音乐曲目的公司)、 ElevenLabs (利用AI语音生成器将文本转换为语音的公司)和 Promethean AI(搜索数字档案以帮助公司设计从视频游戏到摩托车等各种原型的公司)。来源: 智通财经
工信部:大力推进5G、人工智能等数字技术创新应用,加快形成新质生产力
工信部部长到天津制造业重点企业和滨海高新区调研时表示:要开辟发展新领域新赛道,加强科技创新和产业创新深度融合,促进科技成果加速产业化,大力推进5G、人工智能等数字技术创新应用,不断壮大新材料、车联网、生物制造、信创产业、低空经济等新的增长点,加快形成新质生产力。
AI创企竹间智能回应停摆传闻:优化亏损业务,仅少部分岗位停工
针对2月21日晚间在网络流传的公司停工停产传闻,今日,AI创业企业竹间智能正式作出回应。竹间智能表示,公司目前运营正常,所有工作正有序进行中。目前竹间智能正对于部分亏损业务进行优化,其中涉及部分岗位的工作重组计划,进行了少部分岗位的停工,而非全面停工停产。竹间智能上海办公室目前有少数员工在岗,有员工称公司下周一才开始正式上班。
小米影像大脑全面升级为 AISP,号称“首个 AI 大模型计算摄影平台”
在今日晚间的小米 14 Ultra 新品发布会上,小米影像大脑宣布全面升级。据介绍,小米影像大脑升级为“首个 AI 大模型计算摄影平台”,定名为“Xiaomi AISP”,号称通过小米澎湃 OS 深入硬件层,全面整合 CPU、GPU、NPU 和 ISP 的算力,可达 60TOPS。
Stability AI 旗下视频生成工具 Stable Video 正式开放公测
Stability AI 日前宣布在线 AI 视频生成工具 Stable Video 正式面向公众开放开启公测,基于 Stable Video Diffusion 模型,每日提供免费的 150 积分可生成约 15 个视频,支持文生视频和图生视频,单个视频时长为 4 秒。
奥特曼再回应7万亿美元半导体计划:世界需要更多AI芯片,投入超出想象
此前,奥特曼被曝出正从中东地区筹集总计高达7万亿美元的资金,以支持OpenAI的一项半导体计划,并与英伟达展开竞争。关于7万亿美元的高投入,奥特曼在与英特尔CEO基辛格的对谈中表示,“事实的核心在于,我们认为世界将需要更多的人工智能计算(芯片)”。奥特曼称:“这将需要全球大量的投入,超出我们的想象。我们现在还没有一个具体数字”。他还强调了过去一年加快人工智能发展的重要性。他认为人工智能的进步将为人类带来更美好的未来,不过奥特曼也承认,在前进的过程中会有不利的一面。
台积电介绍用于高性能计算与AI芯片的全新一代封装技术
在2月18日-22日召开的ISSCC 2024上,台积电向外界介绍了用于高性能计算与AI芯片的全新一代封装技术,在已有的3D封装基础上,又整合了硅光子技术,以改善互联效果、降低功耗。据台积电业务开发资深副总裁张晓强介绍,这项技术旨在帮助封装更多HBM与Chiplet小芯片,进而提升AI芯片的性能。
消息称社交平台 Reddit 授权数据给谷歌训练 AI,每年 6000 万美元
据路透社报道,三位消息人士透露,社交媒体平台 Reddit 已经与谷歌达成协议,使其内容可用于培训谷歌的人工智能模型。这项合同价值约每年 6000 万美元。彭博社此前也透露了类似的消息,但没有公开与 Reddit 达成交易的对象,路透社今日称与 Reddit 达成交易的大型 AI 公司为谷歌。
三星移动部门负责人透露 Galaxy AI 发展计划,将扩展到可穿戴设备
三星移动部门负责人 TM Roh 近日透露了该公司未来在人工智能 (AI) 方面的计划,以及如何扩展其应用范围。Roh 表示,三星下一步计划是将 Galaxy AI 的应用范围扩展到更多设备和服务,包括可穿戴设备。他透露计划在“不久的将来”将 Galaxy AI 功能引入“部分”Galaxy 可穿戴设备。
李一舟AI课程小程序因违规被暂停服务,个人视频号被禁止关注
李一舟用于售卖AI课程的微信小程序“一舟一课”由于违反《即时通信工具公众信息服务发展管理暂行规定》,已暂停服务。 此外,李一舟的人工智能课在微信视频号橱窗显示已经下架。此前,李一舟视频号橱窗有售价值199元的“每个人的人工智能课”视频课。 在其另一小程序“每个人的人工智能课”上,课程也已经显示无法查看。记者还发现,李一舟的个人视频号现已被禁止关注。不过,其官方视频号“李一舟AI”仍然可以关注。
原谷歌 VideoPoet 的项目研究负责人蒋路已加入 TikTok 大模型团队
据雷峰网报道,原 VideoPoet 的项目研究负责人蒋路已加入 TikTok。龙年伊始,OpenAI 的文生视频大模型 Sora 成为业内关注焦点,蒋路所负责的 VideoPoet 则是谷歌内部对标 Sora 的产品。蒋路不仅是谷歌也是 VideoPoet 的负责人,同时是卡梅隆大学的兼职教授。
AI 平台创企竹间智能被曝停工停产6个月,曾融资数亿人民币
昨日晚间,AI平台创企竹间智能被曝部分部门和岗位将停工停产长达六个月。网传截图显示部分业务及岗位将从2月20日起停工,并进行重组,停工时间从2024年2月20日10时至2024年8月19日19时。竹间智能成立于2015年,创始人是前微软(亚洲)互联网工程院副院长简仁贤,该公司核心业务为基于情感计算、自然语言处理、深度学习、知识工程、文本处理等AI技术,将AI能力整合到企业业务中。据企查查的公开数据显示,竹间智能已经完成7轮融资,已披露的融资总额达数亿人民币。最新已披露具体信息的融资事件为,2022底完成约亿元D轮融资。
2024年2月21日·周三
国务院国资委:中央企业要把发展人工智能放在全局工作中统筹谋划,加快建设一批智能算力中心
据国资委网站,2月19日,国务院国资委召开“AI赋能 产业焕新”中央企业人工智能专题推进会。会议认为,加快推动人工智能发展,是国资央企发挥功能使命,抢抓战略机遇,培育新质生产力,推进高质量发展的必然要求。带头抢抓人工智能赋能传统产业,加快构建数据驱动、人机协同、跨界融合、共创分享的智能经济形态。
信实工业支持的印度语言大模型计划 3 月发布
由印度信实工业、印度理工学院孟买分校等支持的研究联盟BharatGPT计划下个月发布首个类似ChatGPT的服务,这项印度语大型语言模型以印度教深喉哈努曼(Hanuman)的名字命名。BharatGPT当地时间2月20日在孟买举行的技术会议上表示,这些模型目前可以支持11种印度语言,包括印地语、泰米尔语、泰卢固语、马拉雅拉姆语和马拉地语,研发者希望可以扩展至22种印度语言。研发者与信实工业的合作包括在电信和零售等领域的行业应用模型。
纽约时报计划于今年晚些时候推出新的生成式人工智能广告工具
据 Axios 报道,《纽约时报》正在招募合作伙伴,从下个季度开始使用生成人工智能(GenAI) 测试新的广告定位解决方案,计划在今年下半年向营销人员广泛使用这一新工具。该项技术由《纽约时报》内部开发,将根据广告活动的信息或目标,提出广告活动在哪些方面可以发挥最佳效果的建议。
Adobe 为其 Acrobat PDF 软件推出 AI 文档阅读助手测试版
Adobe 正在为其 Acrobat PDF 管理软件添加新的生成式 AI 体验,该软件旨在通过使长文档中的信息更易于查找和理解来“彻底改变数字文档体验”。Adobe 在新闻稿中宣布,这款新工具被称为“AI Assistant in Acrobat”,可以总结文件、回答问题并根据内容推荐更多内容,让用户可以“轻松地与文档聊天”获取他们需要的信息。
AI 芯片初创公司 Recogni 获 1.02 亿美元 C 轮融资
自动驾驶技术和 AI 芯片初创公司 Recogni 宣布完成由 Celesta Capital 和 GreatPoint Ventures 共同领投的 1.02 亿美元 C 轮融资。现有投资者 Mayfield、DNS Capital、BMW i Ventures 和 SW Mobility Fund 参投,加入此轮融资的还有新投资者 Pledge Ventures 和 Tasaru Mobility Investments。筹集的资金将用于推动人工智能推理解决方案的下一代系统开发,以提高性能和能效,同时提供最低的总拥有成本。
AI 医学成像软件初创公司 AZmed 获 1500 万欧元 A 轮融资
法国医疗科技初创公司 AZmed 宣布已获得 1500 万欧元的 A 轮融资,投资者包括 Maison Worms、Techstars和 Tempact Ventures。该公司开发了名为 Rayvolve 的人工智能软件,这是一种诊断辅助工具,旨在识别标准放射照相中的各种异常情况,以节省放射科医生和急诊医生的时间,使检查解释更加高效,并降低了诊断错误的风险。
2024年2月20日·周二
马斯克分享多张罕见照片:英伟达黄仁勋向 OpenAI 签名捐赠首台 DGX-1 AI 系统
马斯克近日在 X 平台分享了多张罕见照片。这些照片记录了英伟达 CEO 黄仁勋于 2016 年向马斯克和 OpenAI 签名捐赠首台 DGX-1 AI 系统的场景。黄仁勋签字内容:“致埃隆和 OpenAI 团队!致计算和人类的未来。我为你们呈上全球首台 DGX-1!”
IDEA研究院产业化项目SPU获数千万元融资,为AI大模型商业应用提供安全保障
粤港澳大湾区数字经济研究院(简称“IDEA研究院”)产业化项目、机密计算技术提供商深圳强基计算技术有限公司(也即“深圳市机密计算科技有限公司”母公司)获数千万元融资,由中金资本旗下基金领投,知时资本担任独家财务顾问。本轮融资将主要用于加速SPU机密计算产品研发生产和在AI大模型、数据要素流通等场景的商业化落地。
三星电子据悉在硅谷成立新团队,开发通用人工智能芯片
知情人士透露,三星电子已在硅谷成立新团队,开发通用人工智能芯片。据悉,谷歌前开发人员Woo Dong-hyuk将领导该团队。来源: 新浪财经 马斯克:Neuralink首位人类受试者已康复,凭思维控制鼠标 据媒体报道,特斯拉CEO马斯克在社交媒体平台X上透露,脑机接口公司Neuralink的首位人类受试者“似乎已完全康复,并能仅凭思维在电脑屏幕上移动鼠标”。Neuralink公司此前已在猴子身上进行了芯片植入实验,并得到美国食品和药物管理局的批准,正式开始了首次脑植入设备的临床试验。
IDC预测:AI手机和PC出货量未来几年将猛增
IDC的最新预测,AI PC的出货量预计将在2024年达到近5000万台。而到2027年,这一数字将攀升至1.67亿台以上,将占全球PC出货量的近60%。IDC预测,到2024年底,下一代AI智能手机的出货量将达到1.7亿部,占智能手机总出货量的近15%。
消息称社交平台 X(原 Twitter)正与 Midjourney 就潜在合作伙伴关系进行谈判
据报道,最近更名为 X 的 Twitter 正在与人工智能图像生成平台 Midjourney 讨论潜在的合作伙伴关系。DogeDesigner 在 X 上报道的这一消息表明,X 正在探索增强其内容创作能力的新方法。Midjourney 的人工智能生成艺术平台允许用户根据文本提示创建独特的图像。如果与 X 集成,该技术可以让用户直接在平台内生成和共享人工智能驱动的视觉效果,为他们的社交媒体体验增添新的维度。此外,集成 X 的 Grok 聊天机器人可以为人工智能生成的图像创造更具吸引力的体验。
微软发布 Visual Studio 2022 17.10 首个预览版更新:改进 GitHub Copilot、自动安装推荐组件
据微软官方新闻稿,微软目前发布了 Visual Studio 2022 17.10 首个预览版本,该版本号称重点改进了 GitHub Copilot,并对设置、扩展组件等方面进行了一系列更新。
Figma CEO 最新专访:Figma 从来不只是一个设计工具,从一开始就是消除想象与现实之间的差距
Figma 联合创始&CEO Dylan Field 在近期接受了 The Verge 的采访。Dylan 提到了将 Figma 扩展到更普遍的生产力软件领域的可能性,不认为 Figma 会进入笔记应用领域,但他们希望探索更多与设计、编码、发布和衡量软件相关的价值链,他们可能通过合作伙伴关系来扩展,而不是独立开发这些功能。此外, Dylan 讨论了 AI 能如何影响设计工作。他认为,AI 的出现降低了设计的门槛,使更多人能够参与其中。他认为,AI 可以提高效率,让设计师在更短的时间内完成更多工作,AI 并不会完全取代人类设计师,因为设计工作中的情感、品牌体验和用户流程等方面,AI 目前还无法涵盖。
OPPO 举行 AI 战略发布会:1+N 智能体生态战略公布,可自由开发 AI 智能体
今天 OPPO 在位于东莞的 OPPO AI 滨海湾数据中心举行了 OPPO AI 战略发布会。此前在 2 月 9 日,OPPO 官方曾宣布向超千万用户推送 ColorOS AI 新春版。同时 OPPO 首席产品官刘作虎也宣布 OPPO 将正式进入 AI 手机时代。而在本次 AI 战略发布会上,OPPO 分享了他们在 AI 战略方面更为详细的规划。来源: IT之家 Midjourney创始人:版权问题暂时无解,AI生图不是要取代艺术家 Midjourney 创始人 David Holz 就 AI 对创意工作的潜在影响问题发表看法。当中他坦言,Midjourney 的数据集构建并未征得在世艺术家或受版权保护作品的同意,引发了广泛讨论。
网易有道听力宝 E6 发布:教材同步、AI 口语听读,首发价 399 元
网易有道推出了一款“有道听力宝 E6”新品,这是一款练习听力口语的便携设备,首发价 399 元。该设备支持课内教材同步,覆盖小初高中英文,还支持站外导入资源,拥有 10TB 云空间。有道听力宝 E6 配有 AI 口语助手,支持 AI 英语定级,还与雅思官方合作,用户可逐句跟读纠音。
微软拟投资 21 亿美元扩大在西班牙 AI 基础设施
美国软件巨头微软副董事长兼总裁Brad Smith在社交媒体网站X上发帖称,公司将在未来两年投资21亿美元,扩大其在西班牙的人工智能和云基础设施。此前,该公司刚刚宣布,未来两年将在德国进行32亿欧元(34.5亿美元)的人工智能投资。
AI 芯片初创公司 Groq 推出大模型最快推理芯片,每秒可生成 500 tokens
AI 芯片初创公司 Groq,谷歌 TPU 团队原班人马,基于自研芯片推出推理加速方案,生成速度已经接近每秒500 tokens。据他们介绍,其推理速度相较于英伟达GPU提高了10倍,成本却降低到十分之一。换言之,任何一个大模型都可以部署实现。目前已经能支持Mixtral 8x7B SMoE、Llama 2的7B和70B这三种模型,并且可直接体验Demo。
字节跳动辟谣推出中文版 Sora:Boximator 还无法作为完善产品落地
今日有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型—— Boximator 。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。对此,字节跳动相关人士回应称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。
DeepMind CEO:人工智能领域最大的突破尚未到来,需要的不仅仅是芯片
谷歌 DeepMind 的首席执行官 Demis Hassabis 近日接受了 WIRED《连线》的采访,讨论了人工智能(AI)的未来和当前的发展。Hassabis 提到,尽管 OpenAI 的 ChatGPT 在技术行业引起了轰动,但他认为 AI 领域最大的突破尚未到来,并且这不仅仅是关于芯片的问题。Hassabis 相信要实现通用人工智能(AGI),除了最大规模的计算能力之外,还需要更多的创新。他强调了在现有技术基础上进行创新的重要性,并提到了 DeepMind 在 AlphaGo 时代就开始的代理、强化学习和规划方面的工作。
字节跳动上线面向小初高学生的 AI 教育产品“河马爱学” APP
近日,字节跳动上线“河马爱学”APP,该产品瞄准小初高学生,主要功能为拍照答题,提供作业、口算、作文批改以及语文作文、英语作文、文学素养等服务。这是该公司针对大语言模型在教育领域的应用所进行的探索,例如“问答”功能,便通过AI机器人“盐盐”提供各类问答服务。根据官网介绍,该产品希望利用大模型技术帮学生自适应学习,提升学习效率,制定科学合适的学习方案,同时帮助老师开展教学。2022年2月,河马爱学智能学习系统已进入安徽省阜南亲情高级中学。
Altman 投资的世界币因 OpenAI Sora 而受到追捧,七天暴涨近两倍
世界币与Sora并没有什么关系,但因为两者都与Sam Altman有关而出现了交集。在OpenAI宣布推出视频生成模型Sora之后,Altman投资的世界币迎来大幅上涨,七天涨幅达到190%。来源: 财联社 机构预估 2026 年搜索量降低 25%,生成式 AI 倒逼搜索引擎变革 市场分析公司 Gartner 近日发布报告,表示生成式 AI 已严重威胁传统搜索引擎,预估 2026 年搜索量将下降 25%,认为企业必须调整营销渠道策略。
机构预估 2026 年搜索量降低 25%,生成式 AI 倒逼搜索引擎变革
机构预估 2026 年搜索量降低 25%,生成式 AI 倒逼搜索引擎变革 市场分析公司 Gartner 近日发布报告,表示生成式 AI 已严重威胁传统搜索引擎,预估 2026 年搜索量将下降 25%,认为企业必须调整营销渠道策略。
2024年2月19日·周一
融资超10亿美金,AI公司「月之暗面」获红杉、小红书、美团、阿里新一轮投资
36氪独家获悉,AI创业公司「月之暗面」近期已完成新一轮超10亿美金融资,投资方包括红杉中国、小红书、美团、阿里,老股东跟投。月之暗面的上一轮融资为2023年获得的超2亿美金融资,投资方包括红杉中国、真格基金等。本轮融资后,月之暗面估值已达约25亿美金,为国内大模型领域的头部企业之一。
英国 AI 芯片独角兽 Graphcore 正考虑出售给海外所有者
据外媒报道,在难以从AI热潮中获利之后,英国AI芯片独角兽Graphcore正考虑出售给海外所有者。业内消息人士称,Graphcore一直在与主要科技公司讨论潜在交易,寻求筹集新资金以弥补严重亏损。Graphcore的高级投资者也大幅提高了他们在该公司所持股份的价值,这可能表明这笔交易的价值可能超过5亿美元(4亿英镑)。
ElevnLabs AI 配音版 Sora 视频刷屏,绝美逼真音效打破「无声电影」
Sora突破之后的突破又来了,语音初创公司ElevenLabs放大招,直接用AI给Sora经典视频完成了配音。网友惊呼离AI完全生成电影又近了一步。
Sora 证明马斯克的是对的,但特斯拉和人类可能都输了
Sora 推出,马斯克可能是心情最复杂的一个。不仅因为其本人与 OpenAI 早年的纠葛,更因为 Sora 实现的其实是特斯拉早几年间一直在探索的方向。2 月 18 日,马斯克在科技主播 @Dr.KnowItAll 一条主题为「OpenAI 的重磅炸弹证实了特斯拉的理论」的视频下留言,称「特斯拉已经能够用精确物理原理制作真实世界视频大约一年了」。特斯拉 AI 和 Sora 训练的思路是一致的:并不是训练 AI 如何生成视频,而是训练 AI 理解和生成一个真实的场景或者世界,视频只是从某一个视角观察这个场景的一段时空。
UC伯克利推出「大世界模型」,支持百万token上下文,还能生成视频
今日GitHub热榜榜首,是最新的开源世界模型。上下文窗口长度达到了100万token,持平了谷歌同时推出的王炸Gemini 1.5,伯克利出品。强大的模型,命名也是简单粗暴——没有任何额外点缀,直接就叫LargeWorldModel(LWM)。LWM支持处理多模态信息,能在100万token中准确找到目标文本,还能一口气看完1小时的视频。
英伟达首次公开目前最快AI超算:搭载4608个H100 GPU
近日,英伟达首次向外界公布了其最新的面向企业的AI超级计算机Eos,同时也是英伟达目前速度最快的AI超级计算机。据介绍,Eos共配备了4608个英伟达H100 GPU,同时还配备了1152个英特尔Xeon Platinum 8480C处理器(每个CPU有56个内核)。Eos还采用了英伟达Mellanox Quantum-2 InfiniBand技术,数据传输速度高达400 Gb/s,对训练大型AI模型和系统扩展至关重要。
马斯克称特斯拉的真实世界模拟和视频生成“全球最佳”,并暗示未来可能推出游戏
OpenAI 周四在其网站上宣布了名为 Sora 的文本转视频生成模型,并展示了一些该系统生成的视频。随后,马斯克在社交媒体上展示了特斯拉去年发布的一些生成视频。在过去几天里,他还发布了几条帖子和回复,讨论了 OpenAI 和特斯拉在视频生成领域的努力,并大力赞扬了特斯拉的真实世界模拟和视频生成能力。
国家网信办发布第四批深度合成服务算法备案信息,vivo 蓝心大模型等 266 个算法在列
国家网信办日前发布公告,根据《互联网信息服务深度合成管理规定》,现公开发布第四批境内深度合成服务算法备案信息。本次共有 266 个算法通过备案,其中包括扫描全能王、vivo 蓝心大模型算法、TCL 智能问答内容生成算法、网易元气生成合成算法、唯品会虚拟试衣算法、摩尔线程多摩态大模型算法、京东文生图模型算法、小冰数字人合成算法等。 点击查看完整备案列表清单 。
2024年2月18日·周日
黄仁勋点评Altman芯片梦:算力成本早已下降,数万亿美元有点烧得慌
OpenAI的首席执行官Altman放话筹集5-7万亿美元打造芯片供应网,以提高AI芯片的产能。在黄仁勋看来,芯片成本早就被打下来了,且未来发展的关键在于芯片的复杂度,而非数量。另一名芯片架构师Keller则嘲讽,他用不到1万亿美元就能实现Altman的芯片梦。
Pika 创始人回应 OpenAI 推出 Sora
在Sora发布之前,Runway和Pika都被认为是视频生成赛道的佼佼者。Sora发布之后,很多人认为,它凭一己之力已经轻松“吊打”且即将“干翻”这两家新兴独角兽公司,并对创业者的命运表示担忧。然而,他们自己对此却似乎兴奋更多于恐惧。Pika创始人郭文景回应称,“我们觉得这是一个很振奋人心的消息,我们已经在筹备直接冲,将直接对标Sora。”此外,郭文景还透露,目前已经在招人了,具体计划暂时还不能对外透露。
消息称三星获得2纳米人工智能芯片订单
近日业界透露,三星电子从日本人工智能创业公司Preferred Networks (PFN)获得了生产人工智能加速器等2纳米制程人工智能芯片的订单。业界分析认为,三星电子之所以被PFN选定,是因为三星电子具备存储器和代工服务的综合能力,可以提供从高带宽存储器(HBM)设计到生产和先进的2.5D封装的全套解决方案。
Sora背后团队:应届博士带队,00后入列,还专门招了艺术生
Sora团队是当前最受关注的技术团队之一,他们的项目负责人评论区非常火爆。团队成员包括两位应届博士毕业生Tim Brooks和William Peebles,以及2022年才刚从密西根大学计算机系本科毕业的00后成员Will DePue。Tim Brooks是DALL-E 3的作者之一,曾在英伟达实习并主导视频生成研究。William Peebles与谢赛宁合作开发了Sora的技术基础之一DiT模型。团队中还有Aditya Ramesh,他是DALL-E的创造者,也是Sora团队的负责人之一。此外,团队还包括一些没有博士学位的成员,如David Schnurr和Joe Taylor,以及一些华人成员,如Li Jing和Yufei Guo。
亚马逊开发出有史以来最大的文本转语音模型,展现“涌现能力”
亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。
字节加大 AI 产品研发:调集多位高管参战,数款重磅产品内测
据Tech星球报道,字节跳动旗下多个部门加大投入对AI产品的研发,成果相继落地,包括抖音电商、巨量引擎等业务部门,其中动作最大的Flow部门除了上线豆包、扣子等AI产品外,还将推出AI角色互动APP“话炉”,以及一款或为图片方面的AI产品“PicPic”。另据消息人士透露,去年12月份,“豆包”的月活已经达到200万,2024年1月份则在此基础上翻了一番。Tech星球还独家了解到,字节跳动产品与战略副总裁朱骏已负责Flow部门的产品线。
扎克伯格解释美科技业为何继续大裁员:与AI无关
今年迄今,美国科技业已有近150家公司宣布裁员近4万人。Meta首席执行官马克·扎克伯格在一次采访中解释为什么科技行业的裁员没有放缓:企业意识到,虽然痛苦,但“精简”是有好处的。扎克伯格在接受采访时被问及科技公司裁员是否与人工智能热潮有关,他说:“就裁员之类的事情而言,我实际上认为这更多的是由于企业试图应对新冠疫情。”
OpenAI Sora 可以一次性生成多机位视频,正在接受测试
OpenAI 近日发布了 Sora 模型,可以根据用户输入的文本描述,生成一段视频内容,一经公布便引发网友热议。然而,Sora 的能力还不止于此。当地时间周六 OpenAI 研究科学家比尔・皮布尔斯 (Bill Peebles) 在 X 上晒图,并表示“这是 Sora 一次性生成的视频样本,并不是我们把 5 个视频拼接在一起。Sora 同时拥有五个不同的视角!”这意味着该模型支持一次性生成多机位视频。
中美 AI 差距扩大:美国96%的亿万富豪财富来自AI,中国 AI 融资衰退
在AI领域的投融资方面,美国在2023年的投融资数量虽然有所下降,但总融资额达到了310亿美元,占全球AI领域交易的近一半。而中国的AI领域投融资数量和总额都出现了下降,特别是在2023年第一季度,融资额和融资量都创下了5年来的最低。彭博数据显示,全球前500名最富有的个人中,有30位持有的财富受益于 AI,而大部分都是美国企业家。今年迄今为止,他们持有的净资产总计增加了1240亿美元,占彭博亿万富翁指数所获得财富总额的96%。而在美国 OpenAI 公司2月15日发布 AI 视频生成模型 Sora 后,可能进一步拉大了中美在 AI 方面的差距。
消息称社交平台 Reddit 与大型 AI 公司达成数据授权协议,每年 6000 万美元
据彭博社昨日报道,社交平台 Reddit 将与一家未透露名称的“大型 AI 公司”达成一项数据授权协议,允许后者访问其用户生成内容平台。该协议的年价值约为 6000 万美元,但由于 Reddit 上市计划仍在制定中,具体细节可能会有变动。
谷歌加速修复 AI 助手 Gemini 问题,拒绝响应比例减半
谷歌近期对其人工智能项目进行了一次重大更新,将 Bard 更名为 Gemini 并发布了诸多新功能,例如支持移动端使用。然而发布初期,Gemini 并非完美。缓慢的推出速度导致并非所有用户都能体验到新功能,部分用户在使用过程中也遇到了问题。不过,谷歌迅速做出了回应。Gemini 产品负责人 Jack Krawczyk 向用户保证,问题正在积极修复中。
2024年2月17日·周六
美国专利局拒绝 OpenAI 将“GPT”注册为商标
美国专利商标局 (PTO) 拒绝 OpenAI 将 GPT 一词注册为商标,他们认为 GPT 的意思是生成式预训练转换器 —— 一个过于笼统的术语,可能会阻止竞争对手将其产品描述为 GPT。PTO 在 2 月 6 日的决定中写道,消费者不知道 GPT 的含义并不重要 —— 因为那些使用该技术的人了解 GPT 指的是一种通用类型的软件,而不仅仅是 OpenAI 产品。
OpenAI 据悉完成一笔交易,其估值达到800亿美元
据媒体援引三名知情人士透露,OpenAI已经完成了一笔交易,这家旧金山人工智能公司的估值达到了800亿美元或更多,在不到10个月的时间里,其估值增长了近两倍。知情人士说,该公司将在由风险投资公司Thrive Capital牵头的所谓要约收购中出售现有股票。该交易允许员工将其在公司的股份套现,而不是通过传统的融资方式为业务运营筹集资金。
软银 CEO 孙正义寻求募资 1000 亿美元创建 AI 芯片公司
周五,媒体援引知情人士透露,软银公司CEO孙正义寻求筹资1000亿美元,创立一家人工智能芯片企业,与英伟达展开竞争,并希望该公司在业务上能与ARM互补。孙正义寻求创建的公司,将与英伟达展开竞争,并在业务上与ARM互补。如果成功,这将是自ChatGPT问世以来,人工智能领域最大的一笔投资,远超微软公司对OpenAI的超过100亿美元投资。孙正义和OpenAI的Sam Altman曾就联合建立半导体制造业务进行过讨论,但目前来看孙正义的项目与Altman的雄心并不一致。
OpenAI 创始人就芯片项目寻求美国政府的支持和批准
据知情人士透露,OpenAI创始人Sam Altman正在努力争取美国政府批准一项大规模的合资企业,以促进AI芯片的全球制造,这一努力可能会引起华盛顿对国家安全和反垄断的担忧。据悉,过去几周,Altman一直在与美国、中东和亚洲的潜在投资者和合作伙伴会面。但他告诉其中一些人,没有华盛顿的绿灯,他无法推进该计划。
AI 软件开发初创公司 Magic 获 1.17 亿美元 B 轮融资
总部位于旧金山的初创公司 Magic AI 在 B 轮融资中筹集了 1.17 亿美元,以进一步开发其旨在实现软件开发自动化的先进人工智能系统。本轮融资由 Nat Friedman 和 Daniel Gross 的 NFDG Ventures 领投,CapitalG 和 Elad Gil 参投。这使得 Magic 迄今为止的总融资额超过 1.45 亿美元。
2024年2月4日·周日
AI 跨境招聘平台 Brix 获 2000 万元天使轮融资
据36氪报道,海外AI跨境招聘平台Brix近日完成两千万元天使轮融资,由峰瑞资本和知名企业家投资人参与领投,plug and play(璞跃)跟投。Brix于2020年12月在美国创立,致力于通过智能化的AI跨境招聘平台,为美国企业提供一站式远程跨境雇佣解决方案。
研究:到 2026 年,生成式 AI 可能会影响娱乐行业超过 20 万个工作岗位
2023 年 11 月 17 日至 12 月 22 日,CVL Economics 对来自美国六个娱乐行业的 300 名高管进行了关于生成人工智能影响的调查。研究发现,到 2026 年,GenAI 可能会影响大约 203800 个娱乐行业工作岗位。大约 72% 的受访公司被认为是 GenAI 的早期采用者。25% 的人已经在使用它,47% 的人计划很快实施。
消息称谷歌将把 Bard 更名为 Gemini,并推出独立应用
据近日泄露的一份文件显示,谷歌计划在本周对其人工智能工具 Bard 进行重大更新。该更新内容暂未正式公布,但据传包括将 Bard 更名为 Gemini。这一改变合乎情理,因为谷歌在 2023 年底推出了名为 Gemini 的全新多模态 AI 模型,并已开始将其整合到包括 Bard 在内的部分产品中,出于简洁性的考虑进行更名也顺理成章。
2024年2月3日·周六
月之暗面正在进行两亿美元融资,投前估值高达 15 亿美元
据AI科技评论报道,月之暗面 Moonshot 近日正在进行 2 亿美元融资,本轮投资由蚂蚁和阿里集团共同投资,投前估值预计 15 亿美元。据了解,月之暗面团队成员人数在100人至200人之间。团队创始人杨植麟是一个90后,本科毕业于清华大学计算机科学与技术系,博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所(LTI),师从苹果AI研究负责人Ruslan Salakhutdinov、谷歌首席科学家William Cohen。
谷歌最新人工智能模型Gemini Pro已在欧洲上市,将与ChatGPT竞争
据外媒报道,谷歌表示,Gemini Pro是谷歌最大的人工智能(AI)模型之一,作为巴德(Bard)的升级版,现已向欧洲用户开放。该模型是一个多模态大模型,这意味着它可以理解和组合不同类型的信息,如文本、代码、音频、图像和视频。通过Gemini,谷歌希望能与OpenAI的热门聊天机器人ChatGPT进行竞争。
OpenAI 推出适配 Apple Vision Pro 头显的 ChatGPT 应用
OpenAI 为 Apple Vision Pro(苹果上个月正式推出的增强现实头显)发布了一款新的 ChatGPT 应用程序。该应用程序允许用户与 OpenAI 的GPT-4 Turbo 模型聊天,这是其自然语言处理系统的最新、最强大的版本。用户可以提出问题、获得答案、获得建议、了解新主题,以及直接在应用程序中生成图像和文本。来源: VentureBeat
Hugging Face 为其 HuggingChat 推出类 GPTs 的 AI 助手创建功能
开源模型社区 Hugging Face 宣布推出第三方、可定制的 HuggingChat 助手,该免费功能允许 HuggingChat(OpenAI ChatGPT 的开源替代品)的用户轻松创建具有特定功能的自定义 AI 聊天机器人,其功能和意图与 OpenAI 的自定义GPT Builder类似。
欧盟成员国批准人工智能法案最终文本
经过长达三年的反复拉扯,欧盟27国代表在本周五对《人工智能法案》(AI Act)的最终协商文本予以确认,标志着这一关键立法已经迈过了“最后的重大障碍”。欧盟最早是在2021年提出AI立法,但随着2022年末ChatGPT上线,欧盟立法者又增加了针对大语言模型、AIGC领域的监管条文。
美图公司收购站酷设计网,丰富 MiracleVision 模型商店生态及版权
美图公司今日发布公告,宣布该公司全资子公司 Meitu Investment Ltd 收购站酷网全部股本,总代价为 3964.05 万美元。站酷成立于 2006 年,号称聚集了来自全球 300 多个城市的设计师、摄影师、插画师等视觉创意从业者,拥有近 1700 万注册用户。本次美图公司收购站酷网计划,主要是为了加速 MiracleVision 模型商店生态及版权、共创能力。
2024年2月2日·周五
东盟发布人工智能治理指南,希望借新技术推动社会发展
当地时间周五,东南亚国家联盟(ASEAN、东盟)发布了人工智能(AI)治理与道德指南,旨在授权东盟的组织和政府负责地设计、开发和部署人工智能系统,并增加用户对人工智能的信任。
商汤科技日日新SenseNova 4.0发布,大模型带来全新的AI体验
商汤科技发布“日日新SenseNova 4.0”,多维度全面升级大模型体系。“日日新SenseNova 4.0”拥有更全⾯的知识覆盖、更可靠的推理能⼒,更优越的长⽂本理解力及更稳定的数字推理能⼒和更强的代码⽣成能⼒,并⽀持跨模态交互。日日新·商量大语言模型-通用版本(SenseChat V4),支持128K语境窗口长度,综合整体评测成绩水平比肩 GPT 4,相较GPT 3.5已经实现全⾯超越。
阿里推出手机操作智能体框架 Mobile-Agent
来自阿里的一篇最新论文,展示了全新手机操纵智能体框架Mobile-Agent,可以玩转10款应用,还能跨越APP完成用户交给的任务,而且即插即用无需训练。依托多模态大模型,整个操纵过程完全基于视觉能力实现,不再需要给APP编写XML操作文档。比如根据指示,它可以自行搜索篮球比赛的结果,然后根据赛况在备忘录中撰写文稿。新的Agent打破了APP的界限,能够跨应用完成任务,成为了真·超级手机助手。
沙特发出生成式人工智能倡议,卡塔尔摩洛哥等16国响应
沙特通信和信息技术部长Abdullah Alswaha 在周三举办的第三届数字合作组织 (DCO)大会上发起了“生成式人工智能倡议”(GenAI for All),包括卡塔尔、巴基斯坦和摩洛哥在内的16个成员国呼应了该倡议。该倡议旨在研究、制定和管理各成员国的AI政策,支持生成式AI技术的发展,提高在AI发展进程中的道德意识。来源: 财联社
巨人网络游戏AI大模型GiantGPT完成备案
2月2日,巨人网络正式完成游戏AI大模型GiantGPT的备案,成为游戏行业首家对外确认实现此成果的企业。这意味着从即日起,巨人网络AI大模型GiantGPT的有关服务可以正式开展业务。据悉,巨人网络大模型GiantGPT是专注于游戏业务的垂类大模型,结合高质量自有数据与互联网公共数据训练,并针对角色演绎、情景推理与长期记忆等基础能力进行深度优化,在巨人自有游戏业务场景应用方面的表现显著优于国内外的闭源通用大模型。
A16Z 最新 AI 洞察|2023 年是 AI 视频元年,2024 年还有难题需要解决
A16Z 合伙人 Justine Moore 最新发布 2024 年 AI 视频展望。Justine 提到,2023 年对于 AI 视频领域来说,是突破性的一年。2023 年初时,公开的文本转视频模型尚不存在。仅仅 12 个月后,数十种视频生成产品已被积极使用,全球有数百万用户通过文本或图像提示创建短片。这些产品仍然有相对的局限性——大多数生成的视频时长为 3~4 秒,输出的质量参差不齐,像角色一致性这样的问题还未得到解决。我们距离用单一文本提示(或甚至多个提示!)创造出皮克斯级别的短片还有很长的路要走。
OpenAI DALL-E 3 模型存在生成“不当内容”漏洞
微软软件工程部门经理 Shane Jones 日前发现 OpenAI 旗下 DALL-E 3 模型存在漏洞,据称能够生成一系列 NSFW 不当内容,在上报相关漏洞后,Shane Jones 却被下达“封口令”,不过该员工最终还是选择向外界披露相关漏洞。
库克回应MR头显价格太贵:使用了5000项专利
苹果CEO库克在周四的财报电话会议上表示,该公司的MR头显Vision Pro价格可能很高,但它包含了大量的技术。当被问及成本时,库克说这款头显的技术包含5000项专利。“如果你从价格的角度来看,这款产品包含了大量的技术。当然,这是建立在苹果花了多年时间进行的许多创新之上的,所有这些都是由AI驱动的。”
黄仁勋:多国寻求建立并运行自主AI基础设施,有望提振英伟达产品需求
英伟达CEO黄仁勋2月1日接受采访表示,多个国家正寻求在本国建立并运行自主人工智能基础设施,这将推动对英伟达产品的需求增长。黄仁勋称,印度、日本、法国和加拿大等多国都在谈论投资“主权人工智能能力”的重要性,“即作为自然资源的数据应为本国利益提炼和生产……对主权人工智能能力的认可是全球性的”。
美国白宫将围绕人工智能展开“立法讨论”
美国白宫的人工智能顾问本·布坎南 (Ben Buchanan) 透露,白宫很快就会围绕人工智能进行“立法讨论”, “拜登将在未来一个月就此展开对话。” 布坎南表示,对于人工智能版权争论,白宫对此没有正式立场,总体优先事项是“拥有一个创新的人工智能生态系统”,同时确保“创造有意义内容的人得到适当的补偿”。
Zoom据悉裁员约150人,将在AI、销售和工程等领域继续招聘
知情人士称,Zoom本周裁员约150人,不到公司员工总数的2%。据悉,Zoom此次裁员并非全公司范围,将在今年继续增加人工智能、销售和工程等领域的员工数量。Zoom发言人表示:“我们会定期评估团队,以确保与公司战略保持一致。作为这项工作的一部分,我们正重新调整部分角色,并继续在未来的关键领域招聘。”
库克表示苹果全新 AI 功能今年发布,iOS 18将迎苹果史上最大升级
今日,苹果发布2024第一财季财报,苹果CEO库克在财报会上表示,苹果将在今年公布新的AI(人工智能)功能。据了解,知名科技记者Mark Gurman此前表示,苹果内部将iOS 18视为有史以来最重要的更新。多种迹象表明,iOS 18可能会加入生成式AI技术,成为苹果史上升级幅度最大的版本之一。
亚马逊推出人工智能购物助手「Rufus」
亚马逊推出名为 Rufus 的人工智能购物助手,与该公司的柯基吉祥物同名。该聊天机器人接受了亚马逊产品库、客户评论以及网络信息的训练,使其能够回答有关产品的问题、进行比较、提供建议等。Rufus 仍处于测试阶段,只会出现在“特定客户”中,然后在未来几周内向更多用户推出。
艾伦人工智能研究所推出完全开源的大语言模型「OLMo」
艾伦人工智能研究所(AI2)推出了对开源人工智能生态系统的突破性新贡献 – OLMo ,这是一个完全开源的大语言模型,为其内部运作提供了前所未有的透明度。OLMo 被 AI2 称为“第一个真正开放的 LLM”,它的脱颖而出之处在于提供的不仅仅是模型代码和权重。该研究所还发布了用于开发 OLMo 的完整训练数据、训练代码、评估基准和工具包。
谷歌推出独立的人工智能图像生成器「ImageFX」
谷歌推出了 ImageFX ,其独立的人工智能文本到图像生成工具。ImageFX 由 Imagen 2 模型提供支持,它也为 Google Bard 的新 AI 图像生成功能提供支持。使用 ImageFX 生成的图像由 SynthID(直接添加到图像像素中的数字水印)标记,并包含 IPTC 元数据,向人们展示有关这些 AI 生成图像的更多信息。
Meta 今年将部署自研定制芯片为 AI 研发助力
媒体援引一份Meta内部文件报道称,Meta计划今年在其数据中心部署一款新版定制芯片,旨在支持其人工智能发展。一位Meta发言人接受采访时表示,该芯片将与该公司购买的其他现成GPU协调工作。
百度文心一言 App 将支持一键生成“数字分身”:一张图、三句话即可创建
百度官方公众号发文宣布,文心一言 App 正在内测数字分身新功能,今(2)日起,iOS 和安卓用户升级新版本 App 后,均可免费使用。官方表示,通过文心一言 App 创建自己的数字分身仅需一张照片、录制三句语音。并且,该“数字人”支持个性化定义名称、声音、MBTI 性格等。
谷歌 Bard 聊天机器人现已支持文生图:可免费生成“高质量且逼真”的图像
谷歌宣布旗下聊天机器人 Bard 的能力又向前迈进了一大步,除了先前的语言处理技能之外,它现在可以生成图片了。Bard 此次新增的图像生成功能将在全球受支持的地区免费提供,由谷歌 Imagen 2 模型提供支持,但需要英语指令。用户现在可以根据向 Bard 提供的描述生成自定义图像。谷歌承诺,Bard 可提供“高质量、逼真的图像输出”。
2024年2月1日·周四
面壁智能MiniCPM发布,为端侧大模型发展按下加速键
2月1日,面壁智能的端侧大模型面壁MiniCPM正式亮相。面壁MiniCPM,凭借2B规模IT精选数据,在多项主流评测榜单中,中英文平均成绩均超越Mistral-7B。此外,面壁MiniCPM的性能还与微软的Phi-2、GPT-4等大模型比肩,甚至在某些方面有所超越。
AI在欧洲迅速普及,调查:去年近四成欧企采用人工智能
AWS委托撰写的一份报告指出,2023年有38%的欧洲企业正在试验人工智能。AWS高管指出,去年一年,生成式人工智能的可访问性激发了消费者和企业对人工智能的兴趣。加速对人工智能的采用,将帮助欧洲更好地实现其2021年提出的“数字十年”愿景。
马斯克展示特斯拉人形机器人 Optimus 二代,步行更流畅
特斯拉首席执行官埃隆・马斯克近日在其社交媒体平台上分享了一段视频,展示了拆下外壳的第二代人形机器人擎天柱(Optimus)迈着稳健的步伐自主行走。
OpenAI:GPT-4帮助制造生物武器的风险很小
在众多“AI威胁论”里,AI技术可能被恐怖分子或别有用心人士用来制造生物武器,无疑是最为耸人听闻的猜测之一。OpenAI最新进行的一项评估实验,就试图对此进行验证。实验结果显示,使用GPT-4“最多只能轻微提升制造生物威胁的信息获取能力”。
前快手技术副总裁王仲远博士接替黄铁军担任智源研究院院长
前快手技术副总裁王仲远博士接任智源研究院院长,全面负责研究院各项工作。自此,黄铁军将不再兼任院长的身份。去年(2023年)6月,他接任智源研究院理事长,负责领导智源的整体战略布局和创新生态构建。据公开资料显示,王仲远博士现年38岁,曾就职于快手、美团、Facebook、微软亚洲研究院等机构。来源: 量子位
字节跳动推出 Coze 国内版「扣子」AI Bot 开发平台
在持续一年的大模型热潮之后,「智能体」成为了科技公司们新的押注方向之一。近日,字节跳动正式推出 「Coze 扣子」 AI Bot 开发平台。任何用户都可以快速、低门槛地搭建自己的 Chatbot,且平台支持用户将其一键发布到飞书、微信公众号、豆包等渠道。
AI 成本太高,包括 Perplexity 在内,多家明星创业公司寻求出售
据The Information报道称,去年“谷歌杀手”Perplexity管理层就合并问题与至少4家公司进行了讨论,Writer近几个月来至少接洽了3家公司,Neeva已被数据库软件提供商Snowflake收购。知情人士透露,Perplexity管理层就合并问题与至少4家公司进行了讨论,他们担心训练AI模型的成本以及来自搜索巨头谷歌的激烈竞争。结果,所有讨论均未达成交易,去年年底,Perplexity搁置了合并谈判。相反,Perplexity以5.2亿美元的估值在B轮融资中筹集了7360万美元。
美图设计室“AI图生视频”功能内测
1月30日, 美图设计室 新功能“AI图生视频”开始内测,该功能内嵌在网页端商拍的编辑器中。记者体验发现,仅需上传一张图片,即可快速生成具有动态效果的视频,目前支持生成MP4和GIF格式,可适应公众号、朋友圈等场景需求。
谷歌拆分了一个关键的人工智能道德监管机构
谷歌的一个关键团队负责审查新的人工智能产品是否符合其负责任的人工智能开发规则,在其领导人本月离职后,该团队面临着不确定的未来。据四位知情人士透露,曾担任其主要内部人工智能道德监管机构的小团队已经失去了领导者,并且正在进行重组。谷歌发言人表示,其工作今后将以更强有力的形式继续进行,但拒绝提供细节。
经济日报:制造升级需“智”取
经济日报第五版文章指出,当前,人工智能技术已展现出对制造业的强大赋能作用。不过也要看到,其发展仍存在一些亟待解决的短板弱项,比如技术瓶颈、人才短缺、产业标准和规范缺失等。对此,从产业角度来看,应通过持续提升算力、打造智能工厂、创新商业模式等举措,实现全链条、全环节、全过程和全周期的系统优化,释放智能化改造的融合效应。巩固提升优势产业,聚焦船舶与海洋工程装备、新能源汽车、通信设备等领域,通过人工智能加强新技术新产品的创新迭代,推动其在5G、智能网联汽车、新材料等领域的应用场景建设,完善产业生态,提升全产业链竞争力。
大众汽车官宣成立人工智能实验室
德国大众汽车集团表示,公司已经建立了自己的人工智能实验室,作为“全球联网的中心和孵化器”。大众表示,其AI公实验室专注于在汽车创新技术领域进行概念验证。最终,来自实验室的AI创新将应用到自己的汽车产品上,使车辆变得更加智能。
2024年1月31日·周三
谷歌DeepMind核心成员被曝离职创业,瞄准AI智能体,曾是Gemini关键负责人
谷歌又被曝出有核心员工离职了,这次离职的是 DeepMind 的核心技术人员,Gemini项目的四位主要开发者之一,Ioannis Antonoglou。自去年九月以来,包括Ioannis Antonoglou在内,已有四位Gemini主要成员离开。Antonoglou目前的两位合伙人,Sherjil Ozair和Misha Laskin,也是之前一起参与Gemini项目的同事。据一位知情人士透露,他们已经开始为自己的初创企业筹集资金,瞄准Agent这个市场。
2023胡润世界500强:OpenAI首上榜,隆基绿能跌出榜单
胡润研究院31日发布《2023胡润世界500强》,OpenAI以500亿美元的价值首次上榜;太阳能电池板制造商隆基绿能、爱尔眼科、顺丰控股、牧原食品等跌出榜单。
智谱AI GLM-4 模型开放 API 正式上线
2024年01月16日,智谱AI正式推出了新一代基座大模型GLM-4,并宣布了一系列产品升级。智谱AI日前宣布GLM-4模型的开放API正式上线。所有开发者均可通过智谱AI的开放平台接入GLM-4模型开放API,便捷高效地体验智谱AI新一代基座大模型GLM-4的强大能力。
业内首个代码大模型标准发布,中国工商银行、科大讯飞、华为、阿里云等参编
据人工智能产业发展联盟 AIIA 消息,2024 年 1 月 25 日,中国信通院联合中国工商银行牵头发布《智能化软件工程技术和应用要求 第 1 部分:代码大模型》标准,该标准适用于企业在代码大模型的研发、评估和验收等过程中,为代码大模型能力的建设和改进提供参考,为代码大模型的技术选型提供指引。
市值登顶全球,微软上财季营收创历史新高,AI需求驱动云业务增收
市场对云计算和AI(人工智能)热情不减,推动全球市值最高的微软在2023年最后三个月取得创纪录的季度营收。当地时间1月30日,科技巨头微软公布截至2023年12月31日的2024财年第二财季业绩,第二财季营收620.20亿美元,高于市场预期的610亿美元并创下微软的季度营收最高纪录,同比增长18%,按固定汇率计算增长16%;净利润同比增长33%(按固定汇率计算增长30%)至218.70亿美元,高于市场预期的206亿美元;摊薄后每股收益同比增长33%(按固定汇率计算增长30%)至2.93美元,高于市场预期的2.77美元。
Alphabet首席执行官皮查伊:Gemini Ultra AI模型将很快面世
谷歌母公司Alphabet首席执行官桑达尔·皮查伊当地时间1月30日在财报电话会议上表示,Google One订阅用户数即将超过1亿;Gemini Ultra AI模型将很快面世,团队已经在开发下一个版本,并将首先应用在搜索产品。
人形机器人初创公司Figure AI据悉与微软、OpenAI进行融资谈判
人形机器人初创公司Figure AI据悉正在洽谈一轮高达5亿美元的融资,由微软公司和OpenAI领投。在一种正讨论方案中,微软将投资约9500万美元,OpenAI将投资500万美元。
ChatGPT 再曝安全漏洞,被指泄露私密对话
风靡全球的聊天机器人 ChatGPT 近日再次陷入安全风波,被曝泄露用户同机器人的私密对话,其中包含用户名、密码等敏感信息。ArsTechnica 网站援引其读者提供的截图报道称,ChatGPT 泄露了多段非用户本人的对话内容,包含了大量敏感信息。该读者原本只是使用 ChatGPT 进行一个无关的查询,却意外发现聊天记录中出现了不属于自己的对话内容。
2024年1月30日·周二
讯飞星火开源-13B 大模型发布,针对国产软硬件环境深度优化
在今日下午的讯飞星火认知大模型 V3.5 升级发布会上,科大讯飞推出了“星火开源大模型”。据介绍,星火开源大模型是根据去年 5 月的星火 1.0 版本(13B)改进而来,增加了数据、能力、针对应用场景的工具链,并且针对国产安全可控进行了更系统性的设计。
科大讯飞发布星火语音大模型,首批 37 个主流语种上超越 OpenAI
今天下午的发布会上,科大讯飞还发布了星火语音大模型,由多语种语音合成,在首批37个主流语种上已整体超越OpenAI公司推出的Whisper-large-v3,保持科大讯飞智能语音技术的国际领先水平。不仅如此,星火语音大模型在首批40个语种平均MOS分绝对提升0.25;MOS达到了4.5,拟人度达到了83%以上。
科大讯飞发布全新星火认知大模型V3.5,多项能力显著提升
今天下午科大讯飞召开发布会,正式公布了 星火认知大模型 V3.5。据介绍,星火认知大模型V3.5在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等核心能力均显著提升。具体来说,七大能力上,文本生成提升7.3%,语言理解提升7.6%,知识问答提升4.7%,逻辑推理提升9.5%,数学能力提升9.8%,代码能力提升8.0%,多模态能力提升6.6%。
万兴“天幕”音视频多媒体大模型发布,与华为云及马投算力达成三方合作
万兴科技今日发布国内首个音视频多媒体大模型万兴“天幕”,并宣布大模型研发中心将正式落户马栏山。据悉,“天幕”聚焦数字创意垂类创作场景,基于15亿创作者及100亿本土化高质量音视频数据,以音视频生成式AI技术为基础,支持全球不同语言,相关能力已在海外规模化商用。此外,万兴科技还与华为云及马投算力达成三方算力合作,天幕大模型的训练则是在国内算力和服务器基础上进行。
Meta 发布开源代码大模型 Code Llama 70B,准确率优于 GPT-3.5
扎克伯格宣布 Meta 最近对其代码生成 AI 模型 Code Llama 70B 进行了更新,号称是迄今为止“最大、性能最优的模型”。Code Llama 工具发布于去年 8 月,所有人都可以免费使用。新版 Code Llama 70B 现在能够处理比之前更多地查询,在 HumanEval 基准测试中的准确率达到了 53%,表现优于 GPT-3.5 的 48.1%,但距离 OpenAI 论文中给出的 GPT-4 准确率(67%)还有一段差距。
智源研究院发布新一代通用向量模型 BGE-M3
近日,智源发布了BGE家族新成员——通用语义向量模型BGE-M3,支持超过100种语言,具备领先的多语言、跨语言检索能力,全面且高质量地支撑“句子”、“段落”、“篇章”、“文档”等不同粒度的输入文本,最大输入长度为 8192,并且一站式集成了稠密检索、稀疏检索、多向量检索三种检索功能,在多个评测基准中达到最优水平。
AI芯片抢购将延续!马斯克:企业每年需投数十亿美元才能保持竞争力
特斯拉CEO埃隆·马斯克将AI军备竞赛比作一场高风险的扑克游戏,称企业每年需要在AI硬件上投入数十亿美元,才能保持竞争力。马斯克表示,仅2024年,特斯拉就将在英伟达AI芯片上花费超5亿美元。
马斯克旗下脑机接口公司 Neuralink 首次将芯片植入人类大脑:只需思考即可控制电子设备
1月30日,马斯克在旗下社交平台X(前推特)上宣布,昨天首位人类接受了Neuralink的植入,目前恢复良好。初步结果显示,神经元尖峰检测很有希望。随后马斯克补充说,“只需思考即可控制你的手机或计算机,并通过它们来控制几乎任何设备。最初的使用者将是那些失去四肢的人。可以想象一下,如果史蒂芬·霍金的沟通速度比打字员或拍卖师更快。这就是我们的目标。”
上海AI实验室发布新一代书生·视觉大模型,视觉核心任务开源领先
近日,上海人工智能实验室(上海AI实验室)联合清华大学、香港中文大学、商汤科技等机构开源新一代书生·视觉大模型(InternVL)。新一代“书生·视觉基础”模型的视觉编码器参数量达60亿(InternVL-6B),首次提出了对比-生成融合的渐进式对齐技术,实现了在互联网级别数据上视觉大模型与语言大模型的精细对齐。
意大利监管机构认定 OpenAI 的 ChatGPT 违反隐私法
据彭博社报道,意大利隐私监管机构表示,OpenAI 的 ChatGPT 以及用于收集用户数据的技术违反了该国的隐私法。意大利机构在声明中表示,“所获得的信息表明 OpenAI 存在一或多项违反欧盟法规的行为”。OpenAI 有 30 天的时间对调查结果做出回应。
2024年1月29日·周一
美政府拟限制中企通过美国云数据训练AI模型?外交部回应
1月29日,针对有记者提问,称美政府拟限制中企通过美国云数据训练AI模型,外交部发言人汪文斌敦促美方不要违背科技发展的客观规律,切实尊重市场经济和公平竞争原则。
李开复零一万物北京公司增资至2.5亿元
天眼查App显示,1月26日,北京零一万物信息技术有限公司发生工商变更,注册资本由1亿人民币增至2.5亿人民币。该公司成立于2023年8月,法定代表人为马杰,执行董事为李开复,经营范围含人工智能应用软件开发、人工智能双创服务平台、人工智能理论与算法软件开发、人工智能基础资源与技术平台等,由零一万物(香港)有限公司全资持股。
百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4
1月29日,百川智能发布超千亿参数的大语言模型Baichuan 3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色,证明了Baichuan 3在自然语言处理和代码生成领域的强大实力。
AI 营销初创公司「奥创光年」半年内再获 1500 万美元 A+ 轮融资
AI全链路营销公司「奥创光年(Mogic Ai)」已于近期完成1500万美元A+轮融资。本轮融资由美图公司、凯辉基金联合领投,彬复资本、万物创投跟投,其中凯辉基金为奥创光年A轮领投基金,万物创投曾参与奥创光年天使轮投资,本轮继续追加投资。这是奥创光年于2023年8月首次披露其A轮千万级美元融资后,仅在半年内再度公布的新一轮融资,本轮融资由华兴资本担任独家财务顾问。
IDC:预计到2027年,中国在AI领域的投资规模将达到381亿美元
IDC预计到2027年,全球在人工智能领域的总投资规模将达到4,236亿美元,2022-2027年间的复合年增长率(CAGR)为26.9%。聚焦中国市场,预计到2027年,中国在AI领域的投资规模将达到381亿美元,占据全球总投资的近9%。
360 全新升级的大模型搜索产品「360 AI 搜索」移动 App 上线
据钛媒体报道,360集团新升级的大模型搜索产品“360 AI搜索”移动App日前正式上架多个安卓应用商店中,版本为1.0.0。据介绍,360 AI 搜索是“新一代答案引擎”,主要为最复杂的搜索查询提供更相关、更全面的答案。当用户在360AI搜索中输入任何问题时,都会触发一系列复杂的处理流程,包括进行问题分析、网页检索、重新匹配排序、提取内容等流程,最终会根据用户的问题生成逻辑清晰、有理有据、追根溯源的答案。
2024年1月27日·周六
ChatGPT 更新可在聊天界面输入@任意GPT商店里的GPTs进行对话
ChatGPT悄悄更新个大功能,看起来要把插件系统迭代掉了。部分(灰度)用户已经收到这样的提示:现在可以在对话中@任意GPT商店里的GPTs,就像在群聊中@一个人。同时,也意味着不同的GPTs之间从此可以共享上下文。整个GPT Store中GPTs的数量已经超过300万,结合多款GPTs打造和执行工作流程,也就是让去AI打工,自己当老板。
特斯拉加大人工智能硬件投入,马斯克计划购买 AMD 芯片
据悉,马斯克在他的X社交媒体平台上谈及AI芯片采购计划表示,特斯拉今年将在英伟达(Nvidia Corp.)的硬件上花费超过5亿美元,之后有人问他是否也会从AMD购买芯片。他回答说,“是的。”马斯克还表示,特斯拉计划在2024年底之前投资超过10亿美元,用于“Dojo”超算项目。
SK海力士计划将 HBM 产能增加一倍以上加注 AI
SK海力士将扩大HBE生产设施投资,对通过硅通孔(TSV)相关的设施投资将比2023年增加一倍以上,力图将产能翻倍,并计划在2024年上半年开始生产其第五代高带宽内存产品HBM3E,以应对高性能AI产品需求的增加。
马斯克:xAI 并未寻求筹集资金
马斯克表示xAI并未与投资者洽谈融资事宜。“xAI没有在筹集资金,我也没有与任何人进行过这方面的对话。”此前有媒体报道该公司寻求筹集至多60亿美元的资金。
美国商务部计划要求云计算公司报告建立AI模型的外国用户
美国商务部长吉娜·雷蒙多表示,美商务部在探索如何强制云计算公司在外国用户试图开发驱动人工智能的模型时进行报告。她说:“我们正在启动一个进程,准备要求美国的云计算公司在每次非美国实体使用其云计算来训练大型语言模型时都告诉我们。”
上海AI实验室开源发布科学大模型“浦科化学”
1月26日,上海人工智能实验室(上海AI实验室)开源发布首个科学大模型浦科化学(ChemLLM),拓展了大模型助力科学研究的探索路径。基于书生·浦语2.0强大的基座模型能力,浦科化学通过注入海量化学专业数据,使大模型获得了理解和处理化学相关专业任务的知识与能力。浦科化学现已开源,并提供免费商用。
2024年1月26日·周五
OpenAI 董事会主席参与创办的 AI 创企 Sierra 接近获 8500 万美元投资
据彭博社报道,知情人士称,OpenAI董事会主席、Salesforce前联席CEO布雷特·泰勒去年参与创办的AI初创公司Sierra接近获得8500万美元投资,预计由红杉资本领投。这笔交易将使Sierra的估值接近10亿美元。来源: 界面新闻
智源发布多模态模型中文评测基准 CMMU,GPT-4V 答题准确率约 30%
智源研究院提出 CMMU —— 中文多模态多题型理解及推理评测基准,当前发布的 CMMU v0.1 版本从中国教育体系规范指导下的全国小学、初中、高中考试题中抽取并制作了3603道题目,题型包括单选题、多选题、填空题,并采用多重评测手段避免模型“随机猜对答案”。CMMU 整体难度较高,OpenAI 推出的 GPT-4V 多模态模型答题准确率在30%左右,经错误类型分析,LMM在图像理解和推理能力方面还有待提高。
消息称马斯克的人工智能初创公司 xAI 寻求筹集 60 亿美元以挑战
OpenAI 多位消息人士称,马斯克旗下的人工智能初创公司xAI正寻求从全球投资者融资60亿美元,为其挑战OpenAI提供资金。知情人士称,马斯克希望以200亿美元的拟议估值为xAI筹集多达60亿美元的资金,他还瞄准了中东地区的主权财富基金,并已经与日本和韩国的投资者进行了接触。其中一位知情人士说,摩根士丹利目前正在协调此次融资。
OpenAI 首席执行官访问韩国,据悉会见三星和 SK 海力士高管
知情人士称,OpenAI首席执行官山姆·奥特曼26日上午走访三星电子平泽工厂参观芯片生产线,与三星高管会面,随后于当天下午同SK海力士高管会晤。据悉,奥特曼原本预定此次访韩停留约6个小时,与半导体企业有关人士会晤,但由于前往三星电子平泽半导体工程参观,他改变了行程,因此改为对韩访问两天。
微步情报智脑XGPT通过备案,系国内首家获批安全大模型
微步在线宣布其安全大模型“情报智脑XGPT”通过《生成式人工智能服务管理暂行办法》备案并正式上线。据悉,这是生成式人工智能备案制正式实施以来,国内网络安全领域首个获批通过的生成式人工智能大模型。
联合国教科文组织将举办全球人工智能论坛
联合国教科文组织25日发布消息称,教科文组织将于2月5日至6日在斯洛文尼亚克拉尼举办全球人工智能论坛,以评估全球人工智能治理进展,并讨论各国正在制定的相关法规,从而确保这项技术服务于人类共同利益。
腾讯文档 AI 智能助手全面开启公测 腾讯文档智能助手
正式开启公测,全面应用于Word、Excel、PPT、PDF、智能文档、收集表、思维导图等文档类型。即日起,智能助手将面向全体用户陆续开放体验。
腾讯发布《2024数字科技前沿应用趋势》,多模态大模型、具身智能、Agent、脑机接口等在列
日前,腾讯研究院联合多个团队,集合顶尖机构研究成果和最新的技术预判,发布了 《2024数字科技前沿应用趋势》 的两万字报告,预测了数字科技未来十大发展趋势和应用前景。未来2-3年,人们有望迎来一个由连接衍生交互、由计算催生智能的时代。
白宫专家:美国将在未来几个月与中国就AI系统安全议题展开合作
面对人工智能(AI)技术快速发展带来的风险与挑战,业界一直期待中美这两个领先国家能够携手合作。美国白宫科技政策办公室主任、首席科学顾问阿拉蒂·普拉巴卡尔近日在接受英国《金融时报》采访时透露,美国将在未来几个月与中国就AI系统安全议题展开合作。
教育部:开展人工智能应用试点示范,建设国家教育数字化大数据中心
1月26日,教育部举办新闻发布会,介绍一年来教育数字化工作进展总体情况。其中提到,下一步,将开展人工智能应用试点示范,推动智能化。建设国家教育数字化大数据中心,强化资源开发利用、公共服务提供、应用发展监测、综合研究分析和安全运维保障,建成数据治理平台、算法赋能平台、算力共享平台,构建标准规划体系和网络安全体系。实施高等学校生成式人工智能创新应用项目,推动生成式人工智能在相关专业领域的应用,以人工智能赋能国家智慧教育平台升级,实现资源个性推送和智能搜索。
2023 ACM Fellow 名单公布,深度学习三巨头及多名华人学者入选
日前,美国计算机协会 ACM(Association for Computing Machinery)公布了最新一届 Fellow 名单。ACM 创立于 1947 年,是全世界计算机领域影响力最大的专业学术组织之一。本年度新入选科学家中共有 68 人,他们的贡献涉及网络安全、人机交互、移动计算和推荐系统等领域。本届 ACM Fellow 包揽了万维网发明者(Tim Berners-Lee)、深度学习三巨头(Geoffrey Hinton、Yoshua Bengio、Yann LeCun)等重磅名人学者,还包括马维英、陈海波等多名华人学者。
阿里云通义千问多模态大模型 Qwen-VL 升级,性能赶超 GPT-4V 和谷歌 Gemini
今日,阿里云公布多模态大模型研究进展。据悉,通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩,整体性能堪比GPT-4V和Gemini Ultra。Qwen-VL-Plus和Qwen-VL-Max在MMMU、MathVista等测评中远超业界所有开源模型,在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上超越GPT-4V,达到世界最佳水平。
小米“小爱同学”、第四范式“式说”、BOSS直聘等 14个 AI 大模型已获得国内新一轮备案批准
近期,国内有13家 AI 公司的14款大模型获得了新一轮备案审批,包括小米的“小爱同学AI助手”新功能、第四范式“式说”大模型、“零一万物”大模型、创思远达“魔方”大模型、步刻科技“微步情报智脑”大模型、BOSS直聘“南北阁”大模型、衔远科技“品商”大模型、衔远科技“摹小仙”大模型、新壹科技“新壹视频”大模型、识因智能“一叶轻舟”大模型、什么值得买“AI 问答机器人”、脉脉“智能问答”新功能、智联招聘“AI 改简历”新功能、掌阅“阅爱聊”微信小程序。
OpenAI 连甩 5 款新模型!价格暴降,功力大涨,还修复了 GPT-4 变懒问题
昨夜,OpenAI发布了一系列重磅大模型更新,连发了五个新模型以及新的API使用管理工具,总体来说可以说是“加量不加价”。更新包括:1. 新的GPT-3.5 Turbo模型、2. 新的GPT-4 Turbo预览模型、3. 新的小型文本嵌入模型text-embedding-3-small、4. 新的大型文本嵌入模型text-embedding-3-large、5. 新的审查模型text-moderation-007 以及价格大幅降低和API管理体验改进。
谷歌云与 Hugging Face 建立战略伙伴关系,合作推动AI发展
1月25日,美国公司Hugging Face宣布与谷歌云建立战略合作伙伴关系。此次合作旨在在开放科学、开源、云计算和硬件方面展开协作,以推动人工智能技术的发展和应用。根据合作协议,Hugging Face将提供其最新的开放模型,而谷歌云则将提供最新的云计算和硬件功能。
美 FTC 将调查微软、亚马逊和谷歌对 OpenAI 和 Anthropic 的投资交易
当地时间周四(1月25日),美国联邦贸易委员会(FTC)宣布,这家机构将对微软、亚马逊和谷歌三家科技巨头向人工智能初创公司OpenAI和Anthropic数十亿美元的投资展开调查。FTC主席莉娜·汗(Lina Khan)在“FTC技术峰会”上公布了这项决定,将其描述为“针对AI开发商与主要云服务提供商之间投资和合作伙伴关系的市场调查”。
英伟达、台积电 CEO 会面共商 AI 芯片供应挑战
英伟达首席执行官黄仁勋本周会见了台积电的首席执行官,讨论了人工智能芯片供应限制问题,这是对2023年开始的人工智能热潮的一个重大挑战。据了解,在这场会面中,作为全球最有价值的两家芯片公司的负责人,黄仁勋讨论了台积电作为英伟达芯片生产商的角色,以及这些芯片目前为全球大多数生成型AI训练系统提供动力。
Rabbit 创始人&CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手
Rabbit CEO 吕骋(Jesse Lyu)在 CES 后在《This Week Startup》节目上与硅谷知名天使投资人 Jason Calacanis 最新对话,长达 90 分钟的对谈详细描述了他最新的产品思考。吕骋强调了技术的演进是为了解决相同的问题,但以更直观的方式。他详细介绍了 LAM (Large Action Model)的工作原理, LAM 旨在提高效率、节省时间,这是一个真正的时间节省装置,让用户更多地专注于其他事情,这一理念是公司的核心驱动力。
2024年1月25日·周四
百度智能云与中国三星达成合作:Galaxy AI 集成文心大模型,带来“即圈即搜”等功能
百度智能云官方公众号今晚发文宣布,在三星 Galaxy S24 系列新品发布会现场,三星电子大中华区用户体验战略副总裁许元默和百度副总裁陈一凡共同宣布,中国三星与百度智能云正式结成 AI 生态战略合作伙伴。据官方介绍,Galaxy AI 深度集成百度文心大模型多项能力,可提供端侧赋能的通话、翻译功能,以及借助生成式 AI 带来的智能摘要、排版等功能。此外,Galaxy S24 系列手机首创了“即圈即搜”,用户在文字、图片或视频上进行简单的手势操作,如画圈、划线等,即可立即获得相关搜索结果。
夸克上线大模型新产品“AI PPT”,可一键生成提纲、创作 PPT
夸克 App 日前已经上线基于大模型的新产品“AI PPT”,用户仅需输入 PPT 主题,就可在几十秒内生成一份 PPT 文件。官方表示,该功能具有“更智能、更专业、更易操作”三大特点,用户在手机端就可完成 PPT 创作,也可使用 iSlide 等平台提供的各类模板。
知情人士:OpenAI 董事会邀请竞争对手加入
据 The Information,知情人士透露,上个月,OpenAI董事会董事AdamD”Angelo曾致电大数据公司Databricks的CEO Ali Ghodsi,询问他是否考虑加入OpenAI董事会。有知情人士表示,D”Angelo的做法可能是出于非营利的考虑,即优先限制人工智能对社会的危害,而不是先赚钱。Ghodsi一直将公司定位为OpenAI的准竞争对手,曾公开建议主要客户开发自己的AI模型或定制开源模型,而不是依赖OpenAI的闭源模型。
OpenAI CEO Altman 与美国国会议员讨论了芯片制造企业的问题
据《华盛顿邮报》报道,OpenAI 首席执行官萨姆·奥特曼 (Sam Altman) 与美国国会议员讨论了增加全球训练和运行人工智能程序所需的先进计算机芯片供应的问题,此前曾报道 Altman 寻求启动一项耗资巨大的合资企业来建造新的芯片工厂。据知情人士透露,奥特曼已经与美国国会议员讨论了在何处以及如何建造新的半导体工厂(业内称为“晶圆厂”)的问题,但他要求匿名讨论私人审议事宜。
SensorTower:2023 年 AI 应用年度下载量和内购收入分别上涨 60% 和 70%
SensorTower最新报告指出,2023年全球非游戏移动应用收入仍稳步增长,达到531亿美元,预计2024年收入达到612亿美元。80款应用年度内购收入超过1亿美元,数量比上年增长23%。《Snapchat》《Spotify》《CapCut》《PictureThis》 《GoodNovel》等在应用商店的内购收入增长突出,首次突破1亿美元。同时,AI应用迎来爆发式增长,活跃AI应用数量激增近160%,超过2000款。与此同时,AI应用年度下载量和收入分别上涨60%和70%,超过21亿次和17亿美元。
特斯拉人形机器人最早明年交付,马斯克:价值潜力远超其他产品总和
1月25日,特斯拉周三盘后发布第四季度财报。在随后的财报电话会议中,特斯拉CEO埃隆·马斯克回应了其要求特斯拉25%投票权一事。针对人形机器人擎天柱(Optimus)的量产问题。马斯克表示,特斯拉在车辆方面的经验实际上很有用,因为该公司的汽车已经是机器人了。他还指出,擎天柱有潜力远远超过特斯拉其他产品的价值总和。马斯克提到,部分擎天柱很有可能在明年某个时候交付。
岩芯数智发布国内首个自研的非Transformer Attention机制的大模型「Yan」
1月24日下午,国内AIGC企业上海岩芯数智人工智能科技有限公司(岩芯数智,RockAI)在上海发布了国内首个自研的非Transformer Attention机制的低算力通用自然语言大模型——Yan模型,记忆能力提升3倍、速度提升7倍,推理吞吐量提升5倍。这是国内首个发布的与ChatGPT不同机制的通用大模型,参数规模达百亿。该公司称,这是用百亿级参数达成千亿参数大模型的性能效果。
Stellantis 收购英国 IT 公司 CloudMade 的 AI 技术,将支持汽车软件开发
当地时间1月24日,Stellantis宣布收购英国IT公司CloudMade的人工智能框架、机器学习模型、知识产权和专利。Stellantis称,CloudMade的软件技术将帮助实现预测性维护和诊断、Stellantis特有的语音辅助、高级导航和地图等功能,“这项交易将支持公司的长期软件战略,并有助于车载平台STLA SmartCockpit的中期开发”。
OpenAI 悄悄放弃了向公众披露关键文件的承诺
据《连线》(WIRED)报道,OpenAI 自成立以来向美国税务机关提交的报告称,任何公众都可以查看其管理文件、财务报表和利益冲突规则的副本。但当《连线》上个月(董事会风波之后)要求提供这些记录时,OpenAI 表示其政策已经改变,该公司只提供了一份狭隘的财务报表,省略了大部分业务。这意味着 OpenAI 放弃了长期以来的透明度承诺,掩盖了一些信息,而这些信息可能会揭示这家对人工智能未来具有重要影响力的公司最近几近崩溃的情况,并可能帮助外界了解其漏洞。
美国国家人工智能研究资源(NAIRR)试点项目启动,多家科技巨头承诺投入资源
美国国家科学基金会已与科技公司合作,帮助学者获得计算能力、数据等,以构建自己的人工智能模型。当地时间周三,该机构启动了国家人工智能研究资源(NAIRR),这是一个试点项目,汇集私营和公共部门的资源来推动 AI 研究和开发。目前,10 个机构和 20 多家公司和组织已承诺支持该倡议。谷歌、英伟达、OpenAI 和亚马逊等巨头承诺向接受该计划的研究人员分享他们的一些工具、硬件和数据集。能源部和 DARPA 等政府机构也同意共享资源,让学术界能够使用超级计算机。
通过相关收购和招聘,苹果悄悄布局 AI 技术
据英国《金融时报》报道,苹果一直在默默进行一系列收购和招聘,为下一代 iPhone 搭载更加强大的本地人工智能技术铺路。报道称,有迹象表明,苹果一直专注于解决“如何在移动设备上运行人工智能”这一技术难题。为此,他们收购了多家 AI 初创公司,最近一次是在去年年初收购了一加州公司 WaveOne,该公司提供基于 AI 的视频压缩技术。据 PitchBook 的数据,自 2017 年初以来,苹果已经收购了 21 家人工智能初创公司。
2024年1月24日·周三
德国软件巨头 SAP 开始大规模重组,专注于人工智能增长
德国软件公司 SAP 宣布到 2024 年将实施 20 亿欧元的重组计划。此次重组将影响8000个工作岗位,目标是“确保 SAP 的技能和资源继续满足未来的业务需求”。自愿离职计划和内部再培训将是重组的主要手段。该公司预计,到 2024 年底,员工人数将保持在类似水平。SAP 还打算重点关注人工智能驱动业务的增长,计划通过其风险投资公司 Sapphire Ventures 向基于人工智能的技术初创公司投资超过 10 亿美元。
英伟达 Jim Fan 最新 TED 演讲上线:AI下一个前沿是「基础智能体」
英伟达高级科学家Jim Fan在TED AI 2023上的演讲视频上线了——AI的下一个前沿将是「基础智能体」(Foundation Agent),一个可以在虚拟世界和现实世界里泛化的通用智能体模型。他具体解释了,这项技术将如何从根本上改变我们的生活,渗透到从视频游戏和元宇宙,到无人机、仿人机器人的方方面面,并探讨了单一模型如何掌握跨越这些不同现实的技能。
蚂蚁集团成立AI创新部NextEvo,前谷歌AI工程师徐鹏担任负责人
蚂蚁集团已在内部成立了AI创新研发与应用部门NextEvo,由蚂蚁集团副总裁徐鹏担任负责人。徐鹏曾在谷歌工作11年,负责和领导了谷歌翻译的核心技术研发,并参与了谷歌显示广告系统的算法研发。NextEvo是蚂蚁内部的AI精锐部门,承担了蚂蚁AI的所有核心技术研发,包括蚂蚁百灵大模型的所有研发工作。
消息称亚马逊计划年内推出付费版 Alexa 语音助手,但 AI 能力还“不及格”
据外媒 Business Insider 报道,亚马逊计划于年内推出 Alexa 智能语音助手的付费升级版本,但目前该付费版本在测试中面临 AI 性能不佳的问题。这一新版本目前暂命名为 Alexa Plus,已有 15000 名外部客户参与测试其底层语音技术 Remarkable Alexa。
阿布扎比成立人工智能委员会,全面负责AI相关政策和战略
阿联酋阿布扎比近期宣布成立人工智能和先进技术委员会(AIATC),该委员会将负责制定和实施与阿布扎比AI和先进技术发展相关的研究、基础设施和投资方面的政策和战略。
三星:暂不考虑未来 Galaxy AI 是否收费,专注让更多用户体验 AI
根据韩媒 mk 报道,三星表示暂不考虑未来 Galaxy AI 是否收费这一问题,而是专注于让更多用户体验到 AI 功能。此前曾报道,三星在官方新闻稿的脚注部分提到“直到 2025 年底 Galaxy AI 功能将在受到支持的三星 Galaxy 设备上免费提供”,并未承诺 2026 年后继续免费提供这些功能。
Chrome浏览器升级,自带三项AI新功能,网上发帖可AI代笔
美东时间1月24日周二,谷歌宣布,当天正式发布新版Chrome浏览器Chrome M121,用AI技术针对浏览器进行升级。谷歌称,Chrome M121拥有三种新的生成式AI功能,可以让浏览器更容易使用,浏览效率更高,同时保持个性化的体验。该版本拥有智能整理标签功能,可自定义设计主题、风格等主题,还可针对网上浏览的任何文本启动“帮我写”功能,做出回复或者提问。
差旅管理平台 TravelPerk 获 1.04 亿美元 D-1 轮扩展融资以加速 AI 的应用
TravelPerk 是一家针对中小企业的商旅管理平台,在由软银愿景基金二期领投的新一轮股权融资中筹集了 1.04 亿美元,Kinnevik 和 Felix Capital 等现有投资者也参与了本轮融资,以加速整合人工智能来自动执行更新航班变更和完成辅助产品采购等任务。
特斯拉开始正式推送自动驾驶辅助系统 FSD v12
特斯拉FSD v12(FSD v12.1.2)已开始正式向用户推送。“FSD Beta v12将城市街道驾驶堆栈升级为端到端神经网络,经过数百万个视频训练,取代了30多万行C++代码。”在更新说明中,特斯拉如此说道。在测评视频中,FSD v12会在斑马线前等待行人过完马路,顺滑避开车道中停止的车辆,会在左/右转后快速变道。
2024年1月23日·周二
腾讯副总裁:今年云业务业绩增长预期乐观,对大模型变现没那么着急
腾讯集团副总裁、政企业务总裁李强在接受澎湃新闻等媒体采访时表示,公司在削减不健康收入的同时,仍然保持大盘收入的较快增长。李强告诉澎湃新闻记者,通过近三年健康可持续战略的调整,腾讯云业绩的增长在提速。并表示“腾讯对于大模型的变现没有那么着急”,大模型赛道现在还处于你追我赶的阶段,过早关注大模型变现,反而会失去关注焦点,公司希望把更多把精力投入在腾讯大模型的能力迭代上,快速追赶国际水平。
彭博推出 AI 驱动的财报电话会议摘要应用
彭博宣布在彭博终端中提供人工智能(AI)驱动的财报电话会议摘要应用,通过人工智能的实际应用助力分析师的研究过程。这项新工具使用户能够解读复杂的财务信息,并快速提取涉及公司管理团队所关切主题的重要见解,例如业绩指引、资本配置、招聘和人力计划、宏观环境、新产品、供应链问题和消费需求等。
中国电信将在上海建设首个国产液冷万卡算力集群,可支撑万亿参数大模型
1月22日,上海徐汇区政府与中国电信上海公司共同举办“算力惠模都 万兆连速城”人工智能公共算力服务产品发布会。中国电信表示,2024年上半年,公司将在上海规划建设15000卡的智算集群,总算力超4500P。其中,单池新建国产算力达万卡,是国内首个单池万卡液冷算力集群。
支付宝宣布“集五福”升级为“五福节”:推出四大 AI 玩法
支付宝在发布会上宣布,今年的“集五福”升级为“五福节”,将于 1 月 29 日开启,2 月 9 日大年三十开奖。今年的“五福节”推出了四大 AI 玩法:飙戏小剧场、时空照相馆、会说话红包、大家来找福,新增五福年货节、过年天天乐。
马斯克在社交平台上透露 Grok 1.5 有望在下个月发布,并将全面改进
特斯拉和 xAI 创始人埃隆·马斯克 (Elon Musk) 表示, Grok 语言模型的下一版本距离向公众推出已经不远了,预计将包括“实质性改进”。针对 X 上的一篇帖子声称 Grok 输出的虚假信息与 xAI 竞争对手 OpenAI 的 ChatGPT 一样多,马斯克周一表示,该系统的 1.5 版本应该在下个月发布。他还表示,新版本将带来“全面”的改进,并在回复中暗示,新版本可能会比当前版本产生更少的幻觉。
Yann LeCun:生成模型不适合处理视频,AI得在抽象空间中进行预测
在 2024 世界经济论坛的一次会谈中,图灵奖得主、Meta 首席 AI 科学家 Yann LeCun 关于“如何让 AI 理解视频数据”表达了自己的看法。他认为,虽然这个问题还没有明确的答案,但适合用来处理视频的模型并不是我们现在大范围应用的生成模型。而且新的模型应该学会在抽象的表征空间中预测,而不是在像素空间中。
谷歌推出模型训练框架 ASPIRE,可令 AI 自我判断输出内容正确性
谷歌日前发布新闻稿,介绍了一款专为大语言模型设计的 ASPIRE 训练框架,该框架号称可以增强 AI 模型的选择性预测能力。研究人员总结称,ASPIRE 框架训练能够显著提升大语言模型输出准确率,即使是较小的模型,也可以在经过微调后进行“准确且有自信”的预测。
微软 Copilot 上线 ChatGPT GPTs 功能,免费邀请部分用户体验
根据国外科技媒体 Windows Latest 报道,微软已经邀请部分 Copilot 用户,体验由 ChatGPT 提供的诸多 GPT 功能。这些 GPT 功能并非 Copilot Pro 用户的专属功能,目前已陆续向普通用户开放。Copilot GPT 不需要微软账户或 Edge 浏览器。根据该媒体测试,可以在 Chrome 浏览器上,不登录微软账号的情况下访问 GPT 功能。目前 Copilot GPT 提供的功能模块比较有限,只有健身、设计或烹饪等基础 GPT。
消息称人工智能独角兽公司 Anthropic 的毛利率为 50%~55%
据 The Information 报道,两位直接了解 Anthropic 利润率数据的知情人士透露,在支付了客户支持和服务器成本后,Anthropic 12 月份的毛利率在 50% 至 55% 之间。Meritech Capital 数据显示,这远低于云软件公司 77% 的平均毛利率水平。
Alphabet 旗下前沿技术 X 实验室裁员几十人,寻求外部投资者
Google 母公司 Alphabet 旗下专门研究前沿技术的实验室 X 正在裁员几十人,同时寻找外部投资者为内部项目提供资金。据知情人士透露,最近几个月,Alphabet 旗下的 X 实验室一直在与风投和其他投资者沟通和讨论融资问题。匿名知情人士和一封致员工的电子邮件称,X 实验室正在采用一种新架构,能让实验项目更容易从部门剥离出来成为独立的创业公司,并得到 Alphabet 和外部支持者的支持。
第四范式「式说」大模型通过生成式 AI 备案
近日,第四范式「式说」大模型正式通过国家《生成式人工智能服务管理暂行办法》备案许可。式说于去年2月发布并经过不断迭代,致力于用生成式 AI 改造企业软件(AIGS),并先后与金融、零售、制造、物流、教育、医疗等行业客户开展大模型合作。
中国一汽联合阿里云通义千问打造的大模型应用 GPT-BI 落地
由中国一汽联合阿里云通义千问打造的大模型应用GPT-BI率先落地,这不仅是中国一汽的首个大模型落地案例,也是汽车行业的首个大模型BI应用。该应用可接收自然语言查询,结合企业数据自动生成分析图表,目前可达到近90%的准确率。相比传统BI(Business Intelligence)的“固定问答”,能实现问答任意组合。
AMD 首批 Instinct MI300X 加速器开始出货
AMD 近日开始量产其最新一代人工智能和高性能计算(HPC)加速器 Instinct MI300X,并率先交付合作伙伴 LaminiAI 使用。LaminiAI 将采用 MI300X 加速器运行大型语言模型(LLM),以满足企业用户的需求。来源: IT之家
英伟达 AI 驱动的游戏重制工具 RTX Remix 公测版正式上线
英伟达旗下 RTX Remix 公开测试版目前已经正式上线,玩家现在可以自由使用工具“重制经典游戏”。NVIDIA RTX Remix 利用全景光线追踪(也称路径追踪)、NVIDIA DLSS、NVIDIA Reflex、现代基于物理的渲染(PBR)以及生成式 AI 纹理工具,帮助 Mod 玩家重制他们最爱的经典游戏。
“脑机接口之父”米格尔:《黑客帝国》在现实世界永远不可能发生
巴西神经生物学家、美国杜克大学医学院神经科学教授、被誉为“脑机接口之父”的米格尔·尼科莱利斯在一次访谈中,犀利的批评马斯克的Neuralink,直言其根本没有作出任何创新。米格尔表示:“脑机接口无法帮助人类实现《黑客帝国》中意识上传的场景,人类的记忆是以模拟方式而非数字方式存储的。”“侵入式脑机接口的初衷是为了科研,对患者并不是最优选择。植入物应仅限于非常严重的病例中或少数全身完全瘫痪的患者。”“未来人工智能并不能取代人类。实际上,目前AI技术仍旧依赖于人类。真正的智能是不可计算的。人类不能被简化为数字逻辑,也不能用公式来表示。”
Canalys:预计在2027年AI手机市场份额将达到45%
Canalys预计,到2024年,智能手机出货量中的5%将是AI手机,到2027年,这一比例将上升至45%。智能手机行业寻找新增长机会的过程中,各个厂商将导入生成式AI作为优先战略,致力于个性化和以体验为导向的创新。
MIT 研究:AI 目前还无法取代人类的大部分工作
麻省理工学院(MIT)最新研究发现,从成本效益方面来看,人工智能(AI)目前还无法取代人类的大部分工作。这项研究试图消除人们对AI在许多行业取代人类的担忧。在AI取代人类劳动力的可行性的首次深入调查中发现,以美元工资衡量,只有23%的工人可以被有效取代。在其他情况下,由于AI辅助视觉识别的安装和操作成本昂贵,人类可以更经济地完成这项工作。
2024年1月22日·周一
上万名英国艺术家联名计划对 Midjourney 等 AI 公司发起集体诉讼
自从Midjourney等AI图像生成软件问世以来,艺术家们开始关注并思考人工智能对他们职业的影响。近日,1.6万名英国艺术家联名,计划对生成式AI软件Midjourney和其他人工智能公司发起集体诉讼。一场持久战预计将在艺术家和AI公司之间打响。
人工智能语音公司 ElevenLabs 融资 8000 万美元,跻身独角兽行列
总部位于英国伦敦的人工智能语音公司 ElevenLabs 在最新一轮融资中成功筹集 8000 万美元,估值飙升至 11 亿美元,正式跻身独角兽行列。本轮融资由知名风投公司 Andreessen Horowitz、企业家 Nat Friedman 和 Daniel Gross 领投,红杉资本(Sequoia Capital)等参投。
OpenAI 联合创始人 Andrej Karpathy:以自动驾驶为例,谈谈AGI
OpenAI 联合创始人、前特斯拉人工智能和视觉总监 Andrej Karpathy 在题为“ Self-driving as a case study for AGI ”的最新博客中以自动驾驶为例,谈到了个人对 AGI 未来形态的看法,认为“自动驾驶能力方面的发展是研究 AGI 的一个很好的早期案例研究”。文中提到的观点如:「Copilot 和 GPT-4 就是“二级”编程自动化」;「AGI 会受到“需求超过供应”的限制,原因在于,开发者的自我限制、监管限制,以及简单直接的资源短缺(如需要建设更多的 GPU 数据中心)」;「在更广泛的工作领域中,许多工作将发生变化,一些工作会消失,但也会出现许多新的工作机会,这更多的是工作的重构而不是直接删除;」
零一万物Yi-VL多模态大模型开源,MMMU、CMMMU两大榜单领先
1 月 22 日,零一万物 Yi 系列模型家族迎来新成员:Yi Vision Language(Yi-VL)多模态语言大模型正式面向全球开源。据悉,Yi-VL 模型基于 Yi 语言模型开发,包括 Yi-VL-34B 和 Yi-VL-6B 两个版本。凭借卓越的图文理解和对话生成能力,Yi-VL 模型在英文数据集 MMMU 和中文数据集 CMMMU 上取得了领先成绩,展示了在复杂跨学科任务上的强大实力。
宝马工厂将部署机器人初创公司 Figure 的人形机器人
美国机器人初创公司Figure表示,其已与汽车制造商宝马(BMW Manufacturing)签署了一项合作协议,将在宝马的美国南卡罗来纳州的斯帕坦堡工厂部署人形机器人。Figure首席执行官称,双方的合作将从少量开始,如果达到了性能目标,就会扩大规模。目前,包括特斯拉、本田等多家汽车制造商都开始使用人形机器人来承担某些体力工作。
数据智能决策初创公司「山景智能」获近亿元A+轮融资
近日,企业数据智能产品及服务提供商山景智能宣布已获得由中科海创基金领投的近亿元A+轮融资。本轮融资将进一步加速山景智能在人工智能领域的技术研发与产品化,尤其在大模型技术的应用方面,有望为各行业带来颠覆性的创新。
四川2024年重点布局和大力发展人工智能产业
四川省第十四届人民代表大会第二次会议22日上午开幕,省长黄强同志作政府工作报告。2024年,四川将以全面落实六大优势产业提质倍增“10条支持政策”,重点布局和大力发展人工智能产业,培育生物技术、卫星网络、新能源与智能网联汽车等新兴产业,力争2024年取得实质性进展。
马斯克支持大胆预言:20年后地球上将有大约10亿个人形机器人
马斯克在X上回帖称:若人类文明基石稳固,20年后地球上可能会有10亿个人形机器人(这一预测源于Midjourney创始人大卫·霍尔茨(David Holz)在社交媒体上的一篇帖子:“我们有理由期待,在21世纪40年代,地球上将有10亿个人形机器人。而到了21世纪60年代,整个太阳系将有1000亿个机器人(主要是外星机器人)。”)。马斯克曾预测,特斯拉开发的人形机器人“擎天柱”将来可能会比电动汽车业务更重要。马斯克希望在三到五年内将擎天柱推向市场,并认为其可在各种环境中自主完成任务。
OpenAI CEO 本周访韩,预计将与 SK 集团会长讨论 AI 芯片合作
韩国东亚日报称,OpenAI CEO Sam Altman 本周将访问韩国首尔,期间可能同 SK 集团会长崔泰源会面,或讨论人工智能芯片合作事宜。还有猜测称,阿尔特曼可能会与三星电子讨论代工和 HBM 合作事宜。
猎户星空发布140亿参数大模型,支持320K上下文,千元级显卡即可运行
1月21日,猎豹移动董事长兼CEO、猎户星空董事长傅盛举办主题为“AI浪潮下如何创新”的AI公开课,并发布支持在千元显卡上运行的企业级基座大模型Orin-14B等多款产品,官方称这款基座大模型完全免费、开源可商用,服务器可置于企业内部。
2024年1月21日·周日
北京获准向公众开放的生成式人工智能大模型产品占全国近一半
1月21日上午,北京市第十六届人民代表大会第二次会议在北京会议中心开幕。市长殷勇作政府工作报告,报告提到北京获准向公众开放的生成式人工智能大模型产品占全国近一半。今年,北京将推动人工智能模型对标国际先进水平,加快在政务、医疗、工业、生活服务等领域应用。
传 OpenAI CEO 正与中东投资者洽谈为潜在的芯片合资企业筹款
媒体报道,人工智能研究公司OpenAI首席执行官山姆·奥尔特曼(Sam Altman)正与中东投资人和芯片制造商们洽谈合作,目标是成立一家新的芯片合资企业,以满足对芯片日益增长的需求并降低对英伟达的依赖。日前曾报道 Altman 正寻求融资数十亿美元,以建立AI芯片工厂网络。
2024年1月20日·周六
微软 CEO 纳德拉:AI 带来的繁荣,不亚于 PC 普及
近日,微软CEO萨提亚·纳德拉(Satya Nadella)参加了2024世界经济论坛,并接受了世界经济论坛主席、德国经济学家克劳斯·施瓦布(Klaus Schwab)的采访,两人就AI的发展进行了深度探讨。纳德拉多次强调人工智能(AI)发展的必要性和安全性,此次AI革命的影响甚至不亚于当初PC(个人电脑)普及,并且随着人工智能的高速发展,AI将为应用程序提供新的界面和新的模型。
Stability AI 推出更小、更高效的 16 亿参数的语言模型 Stable LM 2 1.6B
Stable LM 2 1.6B 是 Stability AI 最新推出的 16 亿参数小型语言模型,基于英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据进行训练。据 Stability AI 称,该模型在大多数基准测试中均优于其他参数低于 20 亿个的小型语言模型,包括微软的Phi-2 (2.7B)、TinyLlama 1.1B和 Falcon 1B。
消息称xAI已获5亿美元投资承诺?马斯克辟谣
据彭博消息,知情人士透露,马斯克旗下人工智能公司xAI已获得5亿美元投资承诺,以实现10亿美元的融资目标。该公司正在讨论150亿至200亿美元的估值,但未来几周内条款仍可能发生变化。马斯克在X上回应:“这是彭博社传的假消息。”
美媒:微软和 OpenAI 面临美国反垄断调查,但尚未清楚哪个部门负责
据报道,美国司法部和美国联邦贸易委员会(FTC)正在深入讨论哪个机构可以以反垄断为由调查OpenAI,包括ChatGPT的创建者与微软(MSFT.O)的关系。三位知情人士透露,几个月前,FTC开始与司法部进行谈判,以确定由谁来审查此事。但知情人士说,这两个机构都不准备放弃管辖权,这需要在美国政府干预这两家公司的合作关系之前得到解决。
英特尔CEO:中国芯片将比美国先进技术差10年,十年后50%的芯片将在美国制造
芯片巨头英特尔首席执行官基辛格在达沃斯上表示,在美国、日本、荷兰联合实施的出口管制环境下,中国与全球顶尖芯片技术有10年的差距。“我相信这预示着(美国在)世界上已经建立的政策。为了(美国)出口和竞争力,在这种环境下,现在,我们正在努力确保这一点。”
OpenAI CEO Altman 据称正寻求融资百亿级美元,以建立AI芯片工厂网络
OpenAI 首席执行官 Altman 正寻求为一家芯片企业筹集巨额资金,规模达到百亿级美元,他的目标是利用这些资金建立一个生产AI芯片的工厂网络。谈判仍处于早期阶段,参与的合作伙伴和出资人的完整名单尚未确定。Altman 担心,随着人工智能的普及,未来将缺乏足够的芯片来进行广泛部署。
据悉谷歌两位AI科学家计划离职并组建人工智能初创公司
据知情人士透露,Alphabet Inc.旗下人工智能部门谷歌 DeepMind 的两位科学家在与投资者讨论在巴黎成立一家人工智能初创公司。这些知情人士表示,该团队与潜在投资者就一轮可能超过2亿欧元(2.2亿美元)的融资进行了磋商—即使对人工智能这个热门领域来说,这也是一笔巨款。
2024年1月19日·周五
世卫组织:AI在医疗领域应用前景广阔,需要各国政府进行监管
世界卫生组织(WHO)周四发布了关于多模态大模型伦理标准和治理指南一文,指出人工智能(AI)在整个医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。
科大讯飞:星火认知大模型 V3.5 将于 1 月 30 日发布
科大讯飞1月19日在投资者互动平台表示,公司将于1月30日发布星火认知大模型V3.5。科大讯飞表示,基于全国产化算力底座“飞星一号”平台的讯飞星火认知大模型V3.5目前已经完成训练,相比V3.0,在逻辑推理、文本生成、数学答题及小样本学习能力方面均实现大幅提升。公司将在1月30日14:00举办讯飞星火认知大模型V3.5升级发布会,科大讯飞视频号等平台将同步进行直播。
OpenAI 宣布与亚利桑那州立大学建立合作关系
周四,OpenAI宣布了与高等教育机构的首次合作。从今年2月开始,亚利桑那州立大学(Arizona State University)将获得ChatGPT企业版的完全访问权限,并计划将其用于课程作业、辅导、研究等方面。
巴克莱银行:AI最大的价值是提高人类劳动力水平
此前,国际货币基金组织(IMF)总裁Kristalina Georgieva认为,人工智能将影响全球约40%的就业岗位。而巴克莱银行则认为,在全球劳动生产率低速增长的背景下,AI的最新突破可以给就业和产业带来重大影响。巴克莱相信,随着人工智能得到更大范围的应用,可以解决一些困扰全球经济的最紧迫问题,如发达国家的人口老龄化和发展中国家的低人均生产力前景。
夸克 App 全面升级,推出搜索问答产品“元知”等多款 AI 应用
凭借自研大模型能力,夸克 App 全新升级多个功能板块和智能工具,推出搜索问答产品“元知”,上线夸克 PC 版以及夸克听记等新产品。围绕智能助手的定位,夸克将为用户提供“内容产品 + 智能工具”的服务矩阵,打造三端一体化的 AI 信息服务体验。
亚马逊 AWS 拟在日本四年投资 152 亿美元拓展云计算设施
全球最大的云计算公司亚马逊网络服务公司(AWS)周五(1月19日)表示,计划到2027年的四年里在日本投资2.26万亿日元(合152.4亿美元),以扩大云计算基础设施,作为人工智能(AI)技术服务的支柱。
Meta 宣布改组旗下 AI 部门,正着手训练自家下一代大语言模型 Llama 3
据外媒 The Verge 报道,Meta 公司最近对自家部门进行了大规模改组,主要整合了自家 AI 研发部门 Facebook AI Research(FAIR)与产品部门,并宣布已开始训练下一代大型语言模型 Llama 3,意图令 AI “成为公司发展核心”。
腾讯发布视频生成模型 VideoCrafter2,光影效果大幅提升
腾讯宣布推出视频生成模型 VideoCrafter 的升级版 VideoCrafter2 ,在光影效果等方面有大幅度改进。VideoCrafter2 可以根据用户提出的文字来生成几秒钟的高质量视频。相比之前的版本,新版在画面质量、人物动作等方面有大幅改进,生成的视频内容真实度更高。
韩国互联网巨头 Kakao 宣布推出多模态大语言模型“蜜蜂”
韩国互联网巨头 Kakao 周五宣布,已开发了名为“蜜蜂”(Honeybee)的多模态大型语言模型(MLLM),以帮助扩大其在人工智能市场的存在。Kakao 新任首席执行官 Chung Shin-a 当天在韩国科技信息通信部主办的人工智能战略会议上表示,“蜜蜂”的开发已经完成,并已在 Github 上分享了“蜜蜂”及其推理代码。
Rabbit R1 将从 Perplexity 的 AI 搜索引擎接收实时信息
在 CES 上推出智能硬件终端 R1 的 Rabbit 公司宣布将与 Perplexity 合作内置 AI 搜索引擎,提供“实时最新答案,没有任何知识中断”。购买前 100000 个 Rabbit R1 设备将附赠一年的 Perplexity Pro 订阅,Pro 版可获得 GPT-4 等大模型的使用,通常每月费用为 20 美元。
OpenAI 宫斗闹剧的背后:LinkedIn 联创霍夫曼扮演了关键角色缓解微软焦虑
在去年11月OpenAI宫斗事件中,霍夫曼缓解了微软CEO纳德拉在奥特曼下台后的担忧。作为LinkedIn的联合创始人,霍夫曼推荐布雷特·泰勒(Bret Taylor)加入了OpenAI现任董事会。因为OpenAI的架构问题,曾担任OpenAI董事会的霍夫曼不太可能再担任该公司董事。
微软 Image Creator 生成图片未来可存储至 OneDrive 云盘
微软网络广告主管 @MParakhin 近日和网友互动时,表示正改进旗下的 AI 图片生成工具 Image Creator,用户生成的图片可以直接存储到 OneDrive 云盘中。
微软推出独立 AI 工具“阅读教练”,辅助提高学习者阅读能力
微软近日发布新闻稿,宣布面向学生群体,推出全新的生成式 AI 工具“阅读教练”( Reading Coach ),通过个性化和有吸引力的练习,帮助学习者提高阅读能力。
Meta 将斥资数十亿美元购买英伟达 AI 芯片
当地时间周四,Meta首席执行官马克·扎克伯格在社交媒体上表示,公司的AI未来路线图要求其建立一个“大规模的计算基础设施”。扎克伯格表示,到2024年底,基础设施将包括35万张英伟达H100显卡。据投行Raymond James的分析师估计,英伟达的H100售价为2.5万至3万美元,如果Meta支付的是价格区间的低端,那么这笔支出将接近90亿美元。
OpenAI CEO 奥特曼:人工智能不该做出“生死攸关”的决定
瑞士达沃斯举办的世界经济论坛上,人工智能初创公司OpenAI的首席执行官萨姆·奥特曼(Sam Altman)于周四发表演讲,他坚定地认为无论人工智能如何发展,人类依然将掌握对世界的最终决定权。
Altman 称比 OpenAI 政变更让他紧张的是超级人工智能
Sam Altman 表示,OpenAI 对他戏剧性又迅速反转的解雇不如这个世界试图让人工智能拥有人类能力的做法般令人不安。“随着世界离强人工智能越来越近,风险、压力和紧张程度,所有这一切都将上升,”这位 OpenAI 首席执行官兼联合创始人周四在世界经济论坛达沃斯年会的一个小组讨论中表示。
云服务器厂商 DigitalOcean 宣布将在其 Paperspace 平台提供 NVIDIA H100 GPU 用于 AI 训练
云服务器厂商 DigitalOcean 宣布在其 Paperspace 平台中提供 NVIDIA H100 Tensor Core GPU,帮助中小企业进行 AI 开发、训练和部署提供云 GPU 和托管。NVIDIA H100 GPU 与 Paperspace 平台的集成带来了处理能力的大幅提升,大大减少了训练 AI 模型和响应数据查询所需的时间。
DeepMind 联合创始人警告称:人工智能是一种“从根本上替代劳动力”的工具
DeepMind 和 Inflection AI 联合创始人 Mustafa Suleyman 在达沃斯世界经济论坛上接受媒体采访时表示,人工智能是一项“令人难以置信的技术”,但从长远来看,它是一种“从根本上取代劳动力”的工具。
Salesforce CEO:科技行业正在努力确保人工智能的开发足够安全
Salesforce 首席执行官马克·贝尼奥夫(Marc Benioff)在瑞士达沃斯举行的世界经济论坛小组会议上表示,科技行业正在制定与正在开发的人工智能软件相关的安全协议并建立信任原则,该软件已席卷全球,以避免“广岛时刻”。
日本芥川奖得主自曝用ChatGPT辅助写作
日本17日公布了第170届芥川奖和直木奖获奖名单。芥川奖由33岁的九段理江以《东京都同情塔》获奖,直木奖则由44岁河崎秋子的《同类相残(暂译)》与47岁万城目学的《八月的御所球场》获得。获得芥川奖的九段理江表示,她使用了ChatGPT来辅助撰写作品,获奖小说中约有5%的文字直接使用了AI生成的内容。
2024年1月18日·周四
联想公布全新 AI 助手“小乐同学”,支持自然语言交互
在昨日(1 月 17 日)举行的联想拯救者及消费生态新品发布会上,联想公布了全新 AI 助手 —— 小乐同学,支持“伴随态自然语言交互 UI”,可一键唤醒、翻译文档、制作 PPT 等,预计三个月后推出正式版。
OpenAI CEO 奥特曼:未来 AI 将会针对不同用户、价值观和地区进行个性化回应
OpenAI CEO山姆·奥特曼(Sam Altman)周三在达沃斯世界经济论坛期间表示,未来的AI产品将能够根据不同的用户、不同的价值观和不同的区域,给出不同的答案。奥特曼在接受媒体专访时称,与现有的大语言模型相比,OpenAI的下一个大模型将能够做“太多、太多”的事情。他说,与之前席卷过硅谷的其他技术相比,AI的发展速度要快得多。
微软CEO纳德拉:未来,每个软件类别、生产力、操作系统、浏览器都将合并在一起,Copilot将是微软真正的AI产品
在前两天于瑞士达沃斯举办的世界经济论坛活动上,微软CEO纳德拉与彭博记者Brad Stone展开了一场对谈。纳德拉表示,过去70年计算机领域在GUI领域的沉淀,与今天基于自然语言的推理引擎融合,这将是一个新的用户界面,更加直观,基于自然语言,但多模态、多轮次、多领域,以及一个推理引擎,几乎每个软件类别,什么是生产力,什么是操作系统,什么是浏览器,从某种意义上都将合并在一起。
苹果的研究人员推出自回归视觉模型AIM
在最新的一篇论文《Scalable Pre-training of Large Autoregressive Image Models》中,苹果的研究者提出了自回归图像模型(AIM),探讨了用自回归目标训练 ViT 模型是否能在学习表征方面获得与 LLMs 相同的扩展能力。研究者发现,模型容量可以轻松扩展到数十亿个参数,并且 AIM 能够有效利用大量未经整理的图像数据。
OpenNLPLab 团队发布新一代注意力机制 Lightning Attention-2
OpenNLPLab 团队尝试一劳永逸地解决大语言模型长序列问题。他们提出并开源了 Lightning Attention-2—— 一种新型的线性注意力机制,让长序列的训练和推理成本与 1K 序列长度的一致。在遇到显存瓶颈之前,无限地增大序列长度并不会对于模型训练速度产生负面影响。这让无限长度预训练成为了可能。同时,超长文本的推理成本也与 1K Tokens 的成本一致甚至更少,这将极大地减少当前大语言模型的推理成本。
钉钉总裁叶军:AI Agent将成超级入口 4月份会推中国版AI Agent Store
作为阿里第一批战略级创新业务,钉钉与1688、闲鱼、夸克在去年年底被列入“阿里四小龙”之列。在OpenAI上线GPT商店前一日,钉钉的AI Agent产品“AI助理”也正式上线,底层由阿里通义千问大模型支持。叶军表示,钉钉计划在4月份推出AI Agent Store,目标是成为国内最活跃的AI Agent孵化、分发和交易平台,三年内产生1000万个AI助理。
三星计划在 2025 年底对部分 Galaxy AI 功能收费
三星今天推出了主打“Galaxy AI”功能的 Galaxy S24 系列旗舰手机,不过三星美国及澳大利亚官方新闻稿角注中提到,相关功能可能将在 2025 年底后转入收费阶段。
谷歌 DeepMind 最新 AI 系统 AlphaGeometry 可解决复杂的奥林匹克几何难题
DeepMind 最新推出一个名为 AlphaGeometry 的 AI 系统,将语言模型与一种称为符号引擎的人工智能相结合,该引擎使用符号和逻辑规则进行推论。在包含 30 个最新奥林匹克级别问题的测试集上,AlphaGeometry 解决了 25 个问题,超越了之前仅解决了 10 个问题的最佳方法,接近了国际数学奥林匹克(IMO)金牌得主的平均表现。
三星 Galaxy S24 Ultra 手机发布:钛合金机身、AI 功能加持,1299 美元起
三星 Galaxy S 系列一直是安卓阵营的顶级旗舰,而 Ultra 型号更是其中的佼佼者。今天三星带来了全新 Galaxy S24 Ultra,不仅拥有全新的钛合金机身、1440p 直屏,还搭载了强大的 AI 功能,售价也随之提升到了 1299 美元。S24 系列搭载了本地和基于云端的 AI 功能,并且运行谷歌的 Gemini 基础模型。值得一提的是,三款新机的 AI 功能完全相同。
Fairly Trained 计划对未侵犯版权的人工智能模型颁发认证
由前 Stability AI 音频副总裁 Ed Newton-Rex 创立的 Fairly Trained 计划为 AI 模型公司颁发/标记一个认证,以证明他们已申请使用受版权保护的训练数据的许可。该组织的第一个认证称为“许可模型认证”(Licensed Model certification),将颁发给那些许可受保护数据来训练其模型的公司,目前已对 9 家从事图像、音乐和语音生成业务的生成式人工智能公司进行了认证。
2024年1月17日·周三
联合国呼吁对AI进行全球风险管理,警告其“严重且意外的后果”
联合国秘书长古特雷斯周三呼吁各国政府和商界领袖优先制定一项全球战略,以应对人工智能(AI)和气候变化的双重威胁。古特雷斯当天在达沃斯论坛上发表演讲时警告称,人工智能的快速发展可能会导致“严重且意想不到的后果”。虽然本届会议的主题为重建信任,但古特雷斯对此颇为悲观。
CodeGeeX 新一代模型上线,支持Code Review、InLine Chat、代码库智能问答等
智谱 AI 2024年度的技术开放日上, CodeGeeX 发布第三代模型。针对CodeGeeX插件产品的系列新功能(新模型加持的代码补全和智能问答、开源代码库智能问答、交互式编程 InLine Chat、代码审查 Code Review、预测推荐候选问题),也同时上线发布,提供给用户免费使用。
工信部:推动人工智能产业高质量发展的标准体系加快形成
工信部就《国家人工智能产业综合标准化体系建设指南》(征求意见稿)公开征求意见。意见提出,到2026年,共性关键技术和应用开发类计划项目形成标准成果的比例达到60%以上,标准与产业科技创新的联动水平持续提升。新制定国家标准和行业标准50项以上,推动人工智能产业高质量发展的标准体系加快形成。
Stability AI 发布 Stable Code 3B 模型,没有 GPU 也能本地运行
在文生图领域大火的 Stability AI,今天宣布了其 2024 年的第一个新 AI 模型:Stable Code 3B。顾名思义,Stable Code 3B 是一个拥有 30 亿参数的模型,专注于辅助代码任务。无需专用 GPU 即可在笔记本电脑上本地运行,同时仍可提供与 Meta 的 CodeLLaMA 7B 等大型模型具有竞争力的性能。
上海AI实验室书生·浦语2.0正式开源,回归语言建模本质
上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0。书生·浦语2.0的核心理念在于回归语言建模的本质,致力于通过提高语料质量及信息密度,实现模型基座语言建模能力获得质的提升。其支持200K token的上下文,一次性接收并处理约30万汉字的输入内容,准确提取关键信息,实现长文本中“大海捞针”。
OpenAI解除“军事禁条”后续:正与美国军方合作开发网络安全工具
在上周刚删除“禁止用于军事用途”条款后,人工智能(AI)“领头羊”OpenAI就宣布正在与五角大楼合作开展包括网络安全工具在内的多个项目,这与该初创公司早些时候禁止向军方提供人工智能的做法背道而驰。
OpenAI 组建新团队,收集公众意见以确保 AI 大模型与人类价值观保持一致
OpenAI 在其博客上宣布,他们正在组建一个名为“集体对齐”(Collective Alignment)的全新团队。这个团队主要由研究人员和工程师构成,将专注于设计和实施收集公众意见的流程,以帮助训练和塑造其人工智能模型的行为,从而解决潜在的偏见和其他问题。
微软CEO纳德拉:全球正在就人工智能形成广泛共识
当地时间周二微软首席执行官萨蒂亚·纳德拉(Satya Nadella)表示,他发现全球在人工智能方面正在形成共识。纳德拉认为,尽管各国对监管这项技术的方式方法可能不同,但探讨人工智能的方式都很相似。
Sam Altman:AGI即将到来,对世界的颠覆远比我们想象要小
OpenAI首席执行官山姆·奥特曼日前表示,人们担心AI有朝一日会变得如此强大,以至于它将极大地重塑和颠覆世界,这种担忧被夸大了;AI对世界的改变将比我们想象的要小得多,对工作的改变也将如此;AGI可能会在“相当近的将来”开发出来。
盖茨在达沃斯谈AI:五年之内将极大地提升生产力
盖茨在达沃斯论坛演讲中表示:“ChatGPT之后,AI可以读,也可以写。这是一个巨大的进步,对于白领工作者而言,可以处理很多日常的工作,很多大量的分析工作都可以瞬间完成,工作效率提升极大。盖茨认为,在五年之内,AI会对生产力有一个极大的提升。
OpenAI首席执行官Sam Altman:不希望使用《纽约时报》的数据进行训练
OpenAI首席执行官Sam Altman表示,OpenAI不希望使用《纽约时报》的数据进行训练;有关媒体版权,将有更多合作伙伴关系出现;OpenAI可能会开发一种“伟大”的版权识别工具。
微软CEO:对现有OpenAI架构没有异议,也没想过掌控更多
在2024年冬季达沃斯论坛上,微软CEO萨提亚·纳德拉(Satya Nadella)在接受采访时表示,尽管希望合作伙伴OpenAI能够有稳定的内部管理,他对其作为非盈利组织的治理架构没有任何意见,也不想让微软对OpenAI拥有更强的掌控。
2024年1月16日·周二
MiniMax 国内首个 MoE 大语言模型 abab6 全量上线
今天,MiniMax 全量发布大语言模型 abab6,为国内首个 MoE 大语言模型。在 MoE 结构下,abab6 拥有大参数带来的处理复杂任务的能力,同时模型在单位时间内能够训练足够多的数据,计算效率也可以得到大幅提升。
国内大模型打假胜诉第一案:阿里云起诉山寨通义千问 App 一审胜诉
国内大模型打假维权出现首例胜诉判决。阿里云、阿里巴巴诉山寨通义千问 App 发布方一审胜诉,飞游科技公司因侵犯注册商标及虚假宣传,被责令赔偿相关经济损失及维权费用,并于官网连续十五日发布道歉声明。
售价9999元,Bose推出全新家庭娱乐扬声器Ultra,配备AI对话模式
Bose宣布推出全新Bose家庭娱乐扬声器Ultra,支持杜比全景声(Dolby Atmos),在享受音乐和电影时为您提供出众的沉浸式体验。新品还配备了AI对话模式,可平衡人声和背景环绕音,带来通透清晰音质。Bose家庭娱乐扬声器Ultra将取代Bose家庭娱乐扬声器850,提供优质的家庭影院体验。Bose家庭娱乐扬声器Ultra即日在中国市场正式发售,售价为9,999元。
腾讯、南开大学等提出一种新的个性化文本到图像生成方法 PhotoMaker
近期,来自南开大学、腾讯等机构的研究人员提出 PhotoMaker —— 一种高效的个性化文本到图像生成方法,可以生成逼真的人像,还能进行其他风格的生成,如草图、漫画、动画等。
智谱AI发布全自研第四代基座大模型 GLM-4,并发布类似于 GPTs 的个性化定制智能体 GLMs
智谱AI今日发布全自研第四代基座大模型GLM-4,且所有更新迭代的能力全量上线。按官方说法,GLM-4性能相比GLM-3提升60%,逼近GPT-4(11月6日最新版本效果)。而同时推出的GLM-4-All Tools,能够完成用户意图理解-复杂指令规划-自由调用GLM生态的多种模型能力。此外,智谱还发布了GLMs,为所有开发者提供AI智能体定制能力,简单prompt指令就能创建个性化GLM智能体。
特斯拉“擎天柱”机器人视频涉嫌造假?马斯克“承认”
埃隆·马斯克周一在社交媒体平台X上分享了一段特斯拉人形机器人擎天柱(Optimus)叠衣服的视频。在马斯克分享视频后不久,就有网友质疑中擎天柱的动作是远程操作的,还有人质疑这个视频是电脑制作的。马斯克随即分享了一些后续信息,承认擎天柱并非自主行为。
元象开源大模型XVERSE-Long-256K,无条件免费商用
元象发布全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,让大模型应用进入“长文本时代”。该模型全开源,无条件免费商用,且附带手把手训练教程,让海量中小企业、研究者和开发者更早一步实现“大模型自由”。
马斯克:在拥有更多特斯拉股份前不开发AI产品
马斯克目前拥有特斯拉超过12%的股份。他表示,如果他没有25%的投票权,他宁愿在特斯拉之外开发AI产品。一直以来,马斯克都认为先进的人工智能技术可能将是“有史以来最具破坏性的技术”。
微软推出 Copilot Pro 订阅:每月 20 美元,可使用 GPT-4 Turbo
微软为其 Copilot 助手推出了新的高级订阅服务 —— Copilot Pro,并将其适用范围扩展到更多设备和应用。Copilot Pro 订阅每用户每月收费 20 美元,支持 Windows PC、Web、App 使用,而且“即将登陆手机”。
OpenAI 发布新工具,避免AI干预选举
在人工智能技术火热的当下,人们越来越担心所谓的Deepfake图像和其他人工智能制作的内容可能在竞选期间误导选民。面对这一问题,美东时间周一,ChatGPT开发商OpenAI最新推出了一系列举措,以防止其产品被用于发布虚假信息,从而扰乱选举。
消息称微软将推出 Copilot Pro 付费订阅版
知名安卓媒体 Android Authority 在分析微软的安卓版 Edge 浏览器应用程序代码时,发现该应用中的代码多次出现了 Copilot Pro 服务的字符串,揭示了微软或推出 Copilot Pro 选项的计划。根据代码显示,Copilot Pro 的权益可能包括访问最新的人工智能模型、生成高质量图像等。
2024年1月15日·周一
非十科技推出免费AI代码助手Fitten Code,称比Copilot快两倍,准确率高20%
非十科技近期推出免费的AI代码助手 Fitten Code ,基于国产深度学习框架计图(Jittor)和非十研发的代码大模型开发,号称生成速度比GitHub Copilot快两倍,准确度提高了约20%。支持代码自动补全、自然语言生成代码、自动添加注释、智能bug查找、解释代码、自动生成单元测试等功能。
谷歌推出 BIG-Bench Mistake 数据集,可协助 AI
语言模型改善自我纠错能力 谷歌研究院日前使用自家 BIG-Bench 基准测试建立了一项“BIG-Bench Mistake”数据集,并利用相关数据集对市面上流行的语言模型“出错概率”及“纠错能力”进行了一系列评估研究。
主审法官谈国内首例AI生成图侵权案:判决激励大家用新工具创作
1月12日下午,首例AI生成图侵权案一审主审法官、北京互联网法院综合审判一庭副庭长朱阁做客中国法学交流基金会举办的公益讲座,就“人工智能生成图著作权相关问题”回应公众关切。朱阁认为如果利用AI大模型产生的内容一概不是作品,那么对于行业来说将会是打击,判决鼓励用户使用AI大模型创作。当工具越来越多样,越来越好用,便能推动产业的发展。
媒体报道称 OpenAI 全球事务副总裁精心策划了 Sam Altman “AI大使”的形象
据外媒报道,作为人工智能初创公司OpenAI的全球事务副总裁,安娜·马坎朱(Anna Makanju)为该公司首席执行官山姆·奥特曼(Sam Altman)精心策划了他的全球首秀。在她的协助下,奥特曼从初创公司的宠儿华丽转身,成为了人工智能领域的大使。然而,随着美国国会对于人工智能技术的监管呼声日益高涨,这也给OpenAI的声誉带来了严峻考验。
消息称苹果将关闭整个加州圣地亚哥 AI 团队,该团队或为 Siri 的数据标注人员
彭博社报道称,苹果即将关闭其位于加州圣地亚哥的 AI 部门,这支拥有 121 人的团队目前正在进行重组,部分员工将调往得州并与奥斯汀团队合并。报道称,这支 121 人的团队被称为“AI 数据操作注释团队(Data Operations Annotations)”,主要负责“Siri 数据运营”,其成员于本周三收到通知:他们必须在 2 月底之前决定是否前往奥斯汀,如果拒绝调岗则将在 4 月 26 日被解雇。
快手最新研究推出兼容 Stable Diffusion 的图生视频插件 I2V-Adapter
近期,由快手主导的一项新研究成果《I2V-Adapter: A General Image-to-Video Adapter for Video Diffusion Models》发布,该研究引入了一个创新的图像到视频转换方法,提出了一种轻量级适配器模块,即 I2V-Adapter,它能够在不需要改变现有文本到视频生成(T2V)模型原始结构和预训练参数的情况下,将静态图像转换成动态视频。
IMF:人工智能将影响全球40%就业
发达国家最受冲击 IMF分析文章显示,人工智能技术将影响全球近40%的就业岗位,相比于新兴市场和低收入国家,发达国家的就业更容易受到人工智能的影响。IMF在报告中写到,人工智能技术将会进一步加剧不同国家之间、不同收入阶层之间的贫富差距。
英伟达从印度获得巨额 AI 芯片订单,价值达 5 亿美元
印度数据中心运营商 Yotta 计划向合作伙伴英伟达追加购买价值 5 亿美元的 AI 芯片,使双方订单总额提升至 10 亿美元,助力 Yotta 进一步强化其人工智能云服务能力。该消息由 Yotta 首席执行官 Sunil Gupta 于近日对路透社透露。
2024年1月14日·周日
2024年硅谷多家科技公司已经宣布裁员多达5500人,或与AI相关
据调查,今年美国科技业已经宣布裁员多达5500人,而与此同时,各大公司加大了对人工智能的投入。科技巨头谷歌、亚马逊都在本周宣布大规模裁员,影响到众多部门。此外,社交平台Discord表示将裁员17%,游戏服务商Unity Software宣布将裁员25%,语言学习应用程序Duolingo则称解雇了10%的正式职工。业内人士指出,裁员既与疫情时期过度招聘有关,又是AI大潮下企业策略调整的必然趋势。
美军方称正快速提升AI能力
据美国国防部网站1月9日报道,美国防部正在通过战略和联盟提升人工智能(AI)能力。报道称,五角大楼一名负责政策的高级官员9日说,在投入使用尖端技术方面,国防部正在取得飞跃式发展。负责军队发展和新兴能力的助理国防部长帮办迈克尔·C·霍罗威茨说,重要的组织和战略更新使国防部提高了将新战术和新技术——尤其是人工智能技术——有效投入战场的能力。
Meta 承认使用“盗版”书籍来训练人工智能,但不会为此付费
在一起诉讼中,Meta 承认使用 Books3 数据集以及许多其他材料来训练 Llama 1 和 Llama 2 大模型。Books3 是一个知名的开源图书数据集,包含近20万本书的纯文本集合,总容量近37GB。但 Meta 辩称其使用受版权保护的作品来训练大模型不需要“同意、许可或付费”,主张任何未经授权复制 Books3 中受版权保护的作品都应被视为“合理使用”。
2024年1月13日·周六
Anthropic 最新研究表明 AI 大模型即使通过了安全训练也依旧具有欺骗性
Claude 聊天机器人背后的人工智能公司 Anthropic 的最新 研究论文 表明,尽管采取了安全训练措施,大模型仍能保留欺骗行为。常规的安全训练技术,包括监督微调、强化学习和对抗性训练,都无法将其移除。“一旦模型表现出欺骗行为,标准技术可能无法消除这种欺骗,并造成是安全的错误假象。”
由 Instagram 联合创始人创办的 AI 驱动的新闻应用 Artifact 宣布将关闭
由 Instagram 联合创始人 Kevin Systrom 和 Mike Krieger 创建的新闻应用 Artifact 即将关闭,原因是市场机会不够大,距离该应用上线不到一年。该应用程序使用人工智能驱动的方法来推荐用户可能喜欢阅读的新闻,但似乎没有吸引足够多的人来让 Artifact 团队继续开发该应用程序。
OpenAI 悄然取消了将 ChatGPT 用于军事用途的禁令
OpenAI 本周悄悄删除了其使用政策中明确禁止将其技术用于军事目的的措辞,该政策旨在规定如何使用 ChatGPT 等强大且非常流行的工具。新政策保留了不得“使用我们的服务伤害自己或他人”的禁令,并以“开发或使用武器”为例,但对“军事和战争”使用的全面禁令已经消失。
中国电信星辰语义大模型 TeleChat-7B 版本宣布开源,并开放 1T 数据集
中国电信 1 月 10 日宣布开源星辰语义大模型 TeleChat-7B 版本,并开放 1T 清洗数据集。此外,中国电信还将在 1 月 20 日开源 12B 版本模型,拥抱更多开发者共建开源大模型生态。据介绍,星辰语义大模型是由中电信人工智能科技有限公司研发训练的大语言模型,采用 1.5 万亿 Tokens 中英文语料进行训练。
2024年1月12日·周五
深度求索推出首个国产开源MoE大模型,性能媲美Llama 2-7B
深度求索团队最新开源160亿参数专家模型DeepSeek MoE,表现完全不输给密集的Llama 2-7B模型,计算量却仅有40%。这个模型堪称19边形战士,特别是在数学和代码能力上对Llama形成了碾压。除了性能上表现优异,DeepSeek MoE主打的就是节约计算量。
罗永浩暂缓AR业务转做大模型?内部人士:不实,仍专注AR研发
针对媒体报道“罗永浩的细红线公司业务从AR转型大模型”一事,该公司人士称,报道不实,罗永浩仍专注于AR软硬件。来源: 新浪科技 罗永浩暂缓AR业务转做大模型,细红线公司软硬件、算法团队半数裁员 近日,搜狐科技从多方信源获悉罗永浩的细红线AR业务软硬件研发放缓、AR相关业务裁员,或将转向大模型行业。据悉,裁员前细红线一软件业务部门正式员工12人,研发10人左右,整体裁了一半的人,其他部门也有陆续裁员。据企查查显示,细红线科技人员规模不足50人,2022年参保人数35人。
阿里云推出第八代企业级实例g8i,AI推理性能提升7倍
日前,阿里云正式发布第八代企业级通用计算实例ECS g8i,基于阿里云自研「飞天+CIPU」架构体系和第五代英特尔至强可扩展处理器,g8i实例的整机性能最高提升85%,AI推理性能最高提升7倍,可支撑高达72B参数的大语言模型,帮助中小规模模型起建成本降低50%。
Rabbit R1 第二批 10000 台预购再次售罄
昨日报道,由渡鸦科技创始人成立的人工智能硬件初创公司 Rabbit 推出的手持式人工智能终端设备 R1 在 2024 年 CES 上首次亮相引起了广泛关注,官方发推称 24 小时内售出了 1 万台(售价 199 美元)。周四该公司推出了第二批预购,但这批 10000 台设备也再度售罄。现第三批产品预购开启,预计交付日期为 2024 年 5 月至 6 月。
肯德基招聘 AI 系统被曝漏洞,入侵后可雇用或拒绝应聘者
根据国外科技媒体 404Media 报道,安全网络专家 MrBruh 意外发现快餐连锁店肯德基(KFC)所用 AI 招聘系统存在漏洞,不仅可以窃取求职者的信息,而且还能掌握该 AI 系统,雇用或拒绝快餐店应聘者。
施华洛世奇推出 Optik AX Visio 望远镜,可利用 AI 实时识别 9000 种鸟类
施华洛世奇今日在 CES 2024 会场中展示了 Optik AX Visio 望远镜,据称是世界上第一台能够识别鸟类的双筒望远镜,售价为 4799 美元。据悉,这款 10 x 32 望远镜拥有 10 倍放大倍率,续航最长 15 小时,内置 NPU 神经处理芯片,号称能够辨认出 9000 种鸟类,并能够实时标注鸟类种类及信息。
比尔·盖茨、萨姆·奥特曼谈 AI,最新一期 Unconfuse Me with Bill Gates 播客对话
比尔·盖茨的播客 Unconfuse Me with Bill Gates 最新一期上线,嘉宾是 OpenAI CEO 萨姆·奥特曼(Sam Altman),该节目录制在奥特曼此前被解除 CEO 职务的事件前,“谈话涵盖了为什么今天的人工智能模型是最愚蠢的,社会将如何适应技术变革,甚至当我们完善了人工智能之后,人类将在哪里找到目标。”
微软与企业级AI内容创作工具 Typeface 合作推出 AI 营销活动功能
在 CES 展会上,微软宣布 Dynamics 365 的更新,其中 Dynamics 365 Customer Insights 和 Typeface 的生成式 AI 平台之间的新集成,有望改变繁琐的营销活动开发工作流程。该 AI 功能可使用自然语言提示和智能建议简化营销活动创建。营销人员只需描述他们的目标或为 Microsoft 的人工智能助手 Copilot 上传创意简介,即可生成集中的项目板。
李飞飞、吴恩达对谈:这一次,AI 冬天不会到来
AI,无疑是今年 CES 展会上最大的亮点。在正在进行的 CES 2024(国际消费电子展)上,著名的 AI 科学家吴恩达和李飞飞出席了「伟大的思想,大胆的愿景」环节的小组讨论,就「人工智能的下一步是什么?」进行了 40 分钟的对谈。两人一致认为,2024 将会是 AI 技术继续深化的一年,同时也会覆盖到更多行业,成为下一次数字革命或工业革命真正的变革性驱动力。
微软市值一度超越苹果,成为全球市值最高的公司
美股周四早盘,微软市值正式超越苹果,成为全球市值最高的公司。微软一度涨2%,盘中市值达到2.89万亿美元,苹果则为2.88万亿美元。不过,目前二者股价仍在剧烈波动之中,“市值之王”头衔随时可能再度易主。由于需求担忧加剧,苹果在2024年迎来了多年来最糟糕的开局,多家华尔街投行调降了这家iPhone制造商的评级。相比之下,微软在人工智能(AI)领域的领先优势吸引了投资者。
OpenAI CEO Sam Altman 与男友在夏威夷举行结婚仪式
据外媒报道,OpenAI首席执行官、Y Combinator 前总裁萨姆·奥特曼(Sam Altman)结婚了。外媒报道称,2024年1月10日,奥特曼与男友奥利弗·穆尔赫林(Oliver Mulherin)在夏威夷举行了一场私密的结婚仪式,交换了结婚誓言。结婚仪式颇为低调,只有至爱亲朋参加。由奥特曼的兄弟杰克·奥特曼(Jack Altman)主持了婚礼,杰克是绩效管理软件公司Lattice的创始人和前首席执行官。
2024年1月11日·周四
吉利汽车发布全栈自研全场景AI大模型——吉利星睿AI大模型
吉利正式发布全球首个汽车行业全栈自研全场景AI大模型——吉利星睿AI大模型。吉利星睿AI大模型以强大的星睿智算中心为算力底座,将自研基础大模型与吉利全球领先的NPDS研发体系、巨量造车全链路场景数据库深度融合,称将成为汽车行业应用场景最丰富、算力最强大、汽车专业知识体系最完备,数据与模型最安全可靠的大模型。
谷歌将在全球范围内继续裁员,包括数百名硬件和语音助手团队员工
彭博社报道称,谷歌已开启新一轮裁员,规模达数百人,受影响的员工包括 Google Assistant 语音助手部门,以及 Pixel 手机、Fitbit 手表和 Nest 智能音响的硬件部门,甚至还涉及到了部分核心工程团队的员工。来源: IT之家
教育部公示中小学人工智能教育基地名单,北京宏志中学等184个入选
教育部基础教育司消息,根据《教育部办公厅关于开展中小学人工智能教育基地推荐工作的通知》(教基厅函〔2023〕29号)要求,各省级教育行政部门共推荐184个中小学人工智能教育基地,现将名单予以公示。公示期为2024年1月11至17日。
高通CEO:AI技术正推动设备全面升级
高通总裁兼首席执行官克里斯蒂亚诺·阿蒙(Cristiano Amon)在CES 2024展会上进行了以“在人工智能时代,我们将如何与设备互动”为主题的演讲。在演讲中,阿蒙谈到了虚拟现实AI技术的企业用例,以及人工智能技术对于智能手机、汽车等设备的赋能。
知情人士称 OpenAI 正与多家媒体进行谈判
知情人士透露,OpenAI公司正在与CNN、福克斯公司、时代周刊三家媒体进行谈判。OpenAI希望从这些出版商处获得它们的内容许可,包括视频和图像、以及文本和内容。目前越来越多关于版权问题地法律诉讼正在给OpenAI带来困扰。
AI 语音公司「思必驰」完成新一轮首期2亿元融资
“思必驰”完成新一轮首期2亿元融资,投资方包括国资基金及其他风险投资基金。本轮后续思必驰将继续加大在语言大模型与人工智能对话技术的研发投入,加速软硬件标准化产品在多场景的落地应用。思必驰成立于2007年,是国内最早一批专注在人工智能领域的企业之一。公司以AI语音语言赛道起家,目前已经形成了包括语音语言交互、软硬一体化人机对话系统、以及大规模自动化AI定制服务在内的产品业务板块。来源: 36氪
OpenAI正式上线基于GPT搭建的定制应用程序的商店——GPT Store
北京时间周四凌晨,OpenAI正式上线了基于其大模型GPT-4等搭建的定制应用程序商店——GPT Store。该应用商店主要针对ChatGPT付费版本开放,其中包括ChatGPT Plus、企业版Enterprise和新推出的付费版本Team,但目前并非所有付费用户都能进入GPT Store的页面。据官方统计数据,用户已经创建了超过300万个GPTs。
OpenAI 推出 ChatGPT Team 付费订阅计划,每人每月为 25/30 美元
OpenAI 近日面向员工数量少于 150 人的小型企业团队,推出了 ChatGPT Team 订阅计划,每人每月为 25/30 美元。OpenAI 此前已经为 ChatGPT 提供了两个付费计划,一个是面向个人用户的 ChatGPT Plus,另一个是面向大型企业的 ChatGPT Enterprise。
腾讯广告发布一站式AI广告创意平台——腾讯广告妙思
腾讯广告在2024腾讯智慧营销峰会上正式发布了以腾讯混元大模型为基底的一站式AI广告创意平台——腾讯广告妙思,助力各行业的广告主及优化师在创意制作、投放流程及广告审核等环节,提升广告生产及投放效率。
V社公布Steam包含AI内容新规:允许发行但需要审核
V社(Valve)公布Steam包含AI内容游戏发行新规,V社表示将发行使用AI技术的游戏,但游戏开发者需要和V社描述在游戏开发和运行的过程中是如何运用 AI 技术的。Valve将会在游戏发行前使用这一披露的信息来对游戏进行审核,同时会将开发者披露的部分信息放在商店页面,供玩家了解该游戏是如何使用AI技术,同时V社在计划上线一套举报游戏实时生存AI内容举报系统。
2024年1月10日·周三
袁进辉新 AI 公司「硅基流动」获创新工场、王慧文等 5000 万投资
OneFlow 创始人、光年之外联合创始人袁进辉近期宣布再次创业,成立新公司硅基流动(SiliconFlow),专注做推理框架,服务大模型的应用。据《晚点 LatePost 》报道,硅基流动已完成 5000 万元人民币天使轮融资,由创新工场领投,耀途资本、奇绩创坛、美团联合创始人王慧文等跟投,投后估值为数亿元人民币。
荣耀发布自研 70 亿参数端侧平台级 AI 大模型“魔法大模型”
在今天的 荣耀 MagicOS 8.0 发布会上,赵明揭晓了荣耀自研端侧 70 亿参数平台级 AI 大模型“魔法大模型”,将由明天发布的荣耀 Magic 6 手机首发。据介绍,“魔法大模型”为荣耀带来了智慧成片、图库语义搜索、一拖日程等功能,这些都是在端侧本地运行的。
淘宝基于AI大模型升级店小蜜产品,将于6月全行业上线
近日,淘宝宣布基于AI大模型升级店小蜜产品,邀请商家测试,预计在2024年6月上线。淘宝方面测试数据显示,店小蜜基于大模型强化AI问答能力后,答案准确率提升至85%,能够服务于售前导购、售后服务、数据洞察、接待质检等环节。
英特尔推出车载AI芯片,挑战英伟达和高通
英特尔周二表示,将推出其最新的人工智能芯片的汽车版本,在为未来的半导体市场上与高通和英伟达展开竞争。英特尔还表示,将收购法国初创公司Silicon Mobility,该公司设计用于控制电动汽车电机和车载充电系统的片上系统技术和软件。
英特尔 CEO CES 主题演讲:世界正在发现人工智能的价值
英特尔CEO盖尔辛格亮相CES展会,发表了有关公司产品战略和计算机未来的深度观点,并深入讨论了很多关于人工智能的话题。盖尔辛格还在讲话中透露,第三代英特尔AI加速器Gaudi 3目前为止测试表现良好。到今年晚些时候,公司将正式发布这一重磅新品。
奇点计算起诉谷歌称其侵犯专有 AI 芯片专利,索赔 16.7 亿美元
奇点计算公司(Singular Computing)近日起诉谷歌,指控该公司 AI 处理器侵犯其两项技术专利,索赔 70 亿美元,在庭审过程中修改为索赔 16.7 亿美元。原告是该公司的计算机科学家约瑟夫・贝茨(Joseph Bates),他告诉陪审员谷歌抄袭了他的技术,并将其用于人工智能开发。贝茨的代表律师称,在 2010 年至 2014 年间,谷歌和贝茨曾讨论过合作前景,贝茨讨论了他的人工智能支持芯片,如何驱动人工智能处理。贝茨指控谷歌抄袭了他的创新成果,并应用该技术开发张量处理单元(TPU),用于谷歌翻译、谷歌搜索、Gmail 和其他服务在内的各种服务。
AI 初创公司 Rabbit 推出智能终端 R1,挑战智能手机市场
AI硬件和操作系统初创公司 Rabbit 近日参加 CES 2024 大展,推出了售价 199 美元的 R1 掌上电脑,希望利用人工智能来改变用户与应用程序的交互方式。R1的外观类似于Playdate游戏机或90年代手持电视的现代版本。它是一个独立的小设备,大约是iPhone的一半大小,配备了2.88英寸的触摸屏、一个用于拍照和录像的旋转摄像头,以及一个滚动轮/按钮,用户可以按它来导航或与设备内置助手交谈。
AI赋能线上零售,沃尔玛携AI购物助手亮相CES
全球最大的零售商沃尔玛在拉斯维加斯举行的消费电子展CES 2024上发布了最新AI技术产品:该公司开放了一种生成式人工智能工具,该工具可以允许购物者按特定用例搜索产品,而不是一次只查找一种产品。来源: 财联社
AI 助力微软发现新材料:80 小时完成 20 年筛选任务,电池中锂用量有望减少 70%
微软和太平洋西北国家实验室(PNNL)合作,借助 AI 力量识别出新材料,应用在电池中,最多可以减少 70% 的锂金属使用量。微软和 PNNL 借助人工智能,筛选了 3200 万种潜在材料,并在 80 小时时间内将名单缩小到 23 种,其中 5 种是已知材料。团队表示如果使用传统方法获取这些材料,这个过程将耗时二十多年。
Mistral AI 发表 Mixtral 8x7B 模型的论文,MMLU 基准测试领先 GPT-3.5 和 LLaMA 2
70B Mistral AI 日前发表了此前于12月中旬发布的 Mixtral 8x7B 模型的论文 ,详细描述了模型的架构,还包含与 LLaMA 2 70B 和 GPT-3.5 进行比较的广泛基准测试。在 MMLU 基准测试中,Mixtral 领先于上述两个模型。相较于更大的模型(例如 Gemini Ultra 或 GPT-4)可达到 85% 到 90% 之间的水平,具体取决于提示方法。
欧盟称将调查微软对OpenAI的投资是否符合欧盟的“并购”规则
欧盟委员会在新闻稿中表示,正在研究大型数字市场参与者与生成式人工智能开发商和提供商之间达成的一些协议。新闻稿写道,欧盟委员会正在调查这些合作伙伴关系对市场动态的影响,并特别提到“正在检查微软对‘开放人工智能研究中心’(OpenAI)的投资是否可以根据《欧盟合并条例》进行审查。”
专注电商及营销场景,AIGC智能设计平台「Nolibox 计算美学」获数千万元A轮融资
36氪获悉,AIGC智能设计平台「Nolibox 计算美学」近期完成数千万元A轮融资。本轮融资获得业内数家头部机构的支持,尖晶资本、GRIP Capital 跟投。本轮融资将用于AIGC技术研发、市场开拓等方面,进一步深化AIGC与电商、营销等应用场景的落地与结合。Nolibox成立于2020年12月,是一家智能设计引擎及平台服务商,为企业提供AIGC一站式图像解决方案。
2024年1月9日·周二
Meta 推出 audio2photoreal AI 框架,输入配音文件即可创建人物对话场景
Meta 日前公布了一项名为 audio2photoreal 的 AI 框架,该框架能够生成一系列逼真的 NPC 人物模型,并借助现有配音文件自动为人物模型“对口型”“摆动作”。
推特前CEO旗下AI初创公司融资3000万美元
两位知情人士今日称,社交平台X(前推特)的前CEO Parag Agrawal近日为旗下一家人工智能(AI)初创公司筹集了约3000万美元的资金。这笔投资由Khosla Ventures领投,后者是AI聊天机器人ChatGPT开发商OpenAI的早期支持者。当前,Agrawal的这家初创公司正在为大型语言模型(LLM)的开发人员和客户开发软件,但这家公司的名称,以及产品的细节信息尚不清楚。其中一位知情人士还表示,另外两家知名风险投资公司Index Ventures和First Round Capital也参与了这轮融资。
生成式AI这一年:从群雄乱战到生态确立,世界已被改变
2022年11月30日,OpenAI的ChatGPT正式上线,从此AI大模型浪潮席卷而来,硅谷创业市场瞬间火爆,风投资本极速转向,二级金融概念股疯狂飙升,科技巨头拉响红色警报,抢夺人类未来的蛋糕争夺战,正式开打。仅仅一年,随着各大资本和巨头入场,AI人工智能的技术迅速发展。从底层大模型,到基础设施,到机器学习操作(MLOps),再到消费端应用,生成式AI的生态已经初步建立,并且将在2024年随着AI的进一步训练和稳定,行业发展会加速向下游移动,人工智能会进一步改变你我的生活,乃至改变整个世界。
《麻省理工科技评论》发布2024年“十大突破性技术”榜单
MIT Technology Review(《麻省理工科技评论》)日前发布2024年“十大突破性技术”榜单,站在新的一年的起点回顾过去一年,其中AI for everything(无处不在的人工智能)上榜,以 ChatGPT 为代表的生成式人工智能工具在创纪录的时间内得到了大规模采用,并重置了整个行业的进程。此外,榜单还包括首例基因编辑治疗、热泵、Twitter Killers(去中心化社交媒体)、增强型地热系统、减肥药、芯粒技术、超高效太阳能电池、苹果 Vision Pro、百亿亿次计算机。
夸克App宣布上线“AI学习助手”,可自主解题提升大学生备考效率
近日,夸克App宣布基于自研大模型推出全新应用“AI学习助手”,该模型采用夸克宝宝虚拟形象为用户进行题目讲解,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。其中,“考点分析”不仅能突出核心考察知识点,还能“详解步骤”展示了解题思路和思考方式。
钉钉正式发布基于70万家企业需求共创的AI助理产品
在今天钉钉7.5产品发布会上,钉钉正式发布了基于70万家企业需求共创的AI助理产品,推动AI的使用门槛进一步降低,让人人都能创造AI助理。钉钉总裁叶军称,随着AIGC浪潮进入生产力和应用场景,AI Agent成为当下最佳AI应用入口,钉钉的目标是成为低门槛、高频和开放的AI助理平台。未来三年,将有1000万个AI助理在钉钉上产生。
百川智能发布Baichuan-NPC,只需简单文字描述就能构建游戏角色
百川智能发布角色大模型 Baichuan-NPC ,并推出了“角色创建平台+搜索增强知识库”的定制化方案。通过这一方案,游戏厂商不用编写任何代码,只需通过简单的文字描述,便可以快速构建角色,实现角色定制。
Getty 和 NVIDIA 推出旗下 iStock 图库平台的 AI 图像生成工具
Getty Images 与 NVIDIA 进一步合作为旗下图库平台 iStock 推出 AI 文本到图像生成功能,售价 14.99 美元,用户可以进行 100 次生成,每次提供四张不同的图像。生成的图片可以用于商业用途,并提供最高 10000 美元的法律版权保护。
OpenAI 表示《纽约时报》对其发起的诉讼“毫无根据”
OpenAI 就《纽约时报》(NYT)提起的版权侵权诉讼发表了一份声明,该报指责 OpenAI 和微软在未经许可的情况下使用数百万篇《纽约时报》文章来训练其 AI 模型。在声明中,OpenAI 重申了对《纽约时报》操纵prompt提示词故意挑起版权侵权的指控。OpenAI 还重申了其立场,即使用公开的互联网材料训练人工智能模型是合理使用。
英伟达将与米哈游、腾讯、网易等游戏公司合作AI数字人业务
记者从英伟达方面了解到,在美国CES 2024展会上,英伟达发布了系列新品,其中的NVIDIA ACE 微服务首次亮相,这是一个使用生成式AI制作虚拟数字人的技术平台,目前与ACE的合作者包括米哈游、网易游戏、掌趣科技、腾讯游戏、育碧等企业。
钉钉用户数达7亿,超70万家企业用上钉钉AI
1月9日,钉钉在7.5产品发布会上公布最新用户数字和商业化数字:截至2023年底,钉钉的用户数已达7亿,包括企业、学校在内的各类组织数达2500万;付费DAU为2800万,软件付费企业数达12万。截至目前,钉钉已有20+条产品线、80多个场景全面接入大模型,完成智能化再造,成为国内首个全面开放AI的国民级工作应用,并且有70万家企业真实使用上了钉钉AI。
英伟达发布 GeForce RTX 40 SUPER 系列显卡及多个领域的最新成果
在今年的CES 2024上,北京时间1月9日0点英伟达举行“NVIDIA CES 特别演讲”。这次发布会,英伟达推出了新的显卡主角:RTX 40 Super系列,并分享涵盖了生成式AI、机器人、智能汽车、游戏设计等多个热门领域的最新成果。
大众汽车宣布将 ChatGPT 引入车载助手
大众汽车今日在 CES 2024 上宣布,其现有的 IDA 语音助手将引入 ChatGPT 人工智能技术,并用于一系列新车型。大众表示,ChatGPT 将在配备最新一代信息娱乐系统的特定车型中启用:ID.7、ID.4、ID.5、ID.3、新款大众途观、新款帕萨特和新高尔夫。
AI 内容创作平台 Contents.com 获 1800 万美元 B 轮融资
面向企业的AI内容创作平台 Contents.com 已筹集 1800 万美元的 B 轮融资,以加速其人工智能内容解决方案的开发和全球扩张。本轮融资由 Alkemia Capital 的 Sinergia Venture Fund 领投,Thomson Reuters Ventures、FNDX 和 Invictus Capital 跟投。
AMD Ryzen 8000 系列芯片获得 AI 升级
AMD 宣布推出新的专注于人工智能的芯片后不久,该公司又推出了更多芯片。AMD 最新在 CES 2024 上推出了 Ryzen 8000 系列桌面处理器,与去年 12 月宣布的 Ryzen 8040 移动 APU 系列一样,据 AMD 称,这些芯片也是为了更好地处理 AI。
安全软件公司 McAffee 推出人工智能技术来检测复杂的 Deepfake
音频 在本周的 CES 2024 上,网络安全公司 McAfee 推出了新的 AI 技术“Project Mockingbird”,可使用人工智能模型来分析视频并辨别音频是否可能被深度伪造技术操纵。早期测试表明,McAffee的检测系统在识别人工生成的冒充真人的虚假音频方面的准确率超过 90%。
诺华、礼来与Alphabet旗下AI制药企业Isomorphic Labs达成新合作,价值30亿美元
Alphabet(谷歌母公司)旗下AI制药企业 Isomorphic Labs 日前宣布与全球制药巨头礼来和诺华建立战略合作。该AI药企发文表示,这些合作或为公司带来近30亿美元的价值(不包括未来药物销售可能产生的特许权使用费)。这两项合作都是多靶点的,重点关注小分子。
2024年1月8日·周一
400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低
StreamingLLM可以在不牺牲生成效果、推理速度的前提下,实现多轮对话共400万个token,22.2倍推理速度提升。该项目在上线不到3个月时间内,GitHub项目标星达到5.7k star。不过,StreamingLLM使用原生PyTorch实现,对于多轮对话推理场景落地应用的低成本、低延迟、高吞吐等需求仍有优化空间。Colossal-AI团队开源了SwiftInfer,基于TensorRT的StreamingLLM,可以进一步提升大模型推理性能46%,有效解决如上问题。
AI 安全软件公司 SentinelOne 以超过 1 亿美元的价格收购印度安全初创公司 PingSafe
上周,在纽约证券交易所上市的人工智能安全公司 SentinelOne 宣布收购印度的安全初创公司 PingSafe,将以现金和股票交易,但没有透露具体财务条款。据 TechCrunch 最新报道,两名知情人士称此次的交易对 PingSafe 的估值超过 1 亿美元。PingSafe 成立于 2021 年,是一家相对较新的小型安全公司,员工不到 100 名,客户超过 50 名,其中大部分位于印度。
智能三维光学芯片公司「中科融合」完成数千万元战略轮融资
中科融合宣布已于2023年底完成数千万元战略轮融资,本轮融资由老股东万讯自控及海南明沣等联合投资,华兴资本担任财务顾问。相关资金将用于公司先进光学智能传感核心模组工厂建设、工业信号链芯片研发、核心技术产品优化升级、人才团队建设及市场化推广。
OpenAI警告:限用版权作品训练可能摧毁人工智能的发展
ChatGPT开发商OpenAI警告称,禁止使用新闻和书籍来训练聊天机器人将摧毁人工智能的发展。OpenAI表示,如果被禁止依赖受版权保护的作品,它将“不可能”创建像ChatGPT这样的服务。
脑机接口厂商「星愿智能」再获数百万元天使轮融资
围绕非侵入式脑机接口技术,提供脑机接口软硬件设备的厂商「星愿智能」于近日获数百万元天使轮+融资,投资方为溪山天使汇。此轮融资将用于新品研发和市场拓展。星愿智能产品受众群体以精神疾病患者为主,脑机接口技术能够检测用户的抑郁情绪、焦虑情绪、运动想象以及注意力。
阿里云副总裁陈雪松据悉已离职,或投身AI赛道
阿里云副总裁陈雪松据悉已离职,据消息人士透露,陈雪松离职后或将选择AI赛道。陈雪松长期在数字化业务线工作,有着丰富的经验。此前曾担任旷视高级副总裁、城市业务事业部总经理。后于2022年出任阿里云副总裁(P10职级),负责数字政府部的相关业务线,向阿里集团副总裁、数字政府总裁许诗军汇报。来源: Tech星球
Mark Gurman:苹果计划在 6 月 WWDC 2024 上发布一系列生成式 AI 工具
知名苹果爆料人马克・古尔曼(Mark Gurman)在最新一期“Power On”中透露:苹果计划在 6 月份的全球开发者大会(WWDC)上推出一系列基于生成式人工智能的工具。古尔曼表示,这些新工具将作为 iOS 18 的一部分出现在大家眼前,包括一个改进版的 Siri。新版 Siri 据称将具备更自然的对话能力,并提供更加个性化的用户体验。
2024年1月7日·周日
2024 CSRankings全球计算机科学排名发布,AI领域中国高校霸榜,清华排名第一
CSRankings 2024结果出炉,全世界计算机科学机构的排名进行了大更新。在AI板块,清华、北大、上交分列TOP 3,CMU和浙大并列第4。AI TOP 10中的中国高校,还包括人大、南京大学、复旦大学、哈工大等。
性能大降接近25%,英伟达公布两款消费级“中国特供版”芯片,以应对美国禁令
芯片巨头英伟达(NVIDIA)日前悄悄在官网上线英伟达RTX 5880 Ada工作站显卡,主要面向消费级和 AI 训推等专业领域应用的芯片产品。不过,该显卡相比旗舰级RTX 6000,单精度浮点性能降低24%左右,整体性能减少接近1/4,实际表现或接近次旗舰性能的RTX 5000。对于英伟达消费级RTX 5880和4090D显卡是否能用于 AI 模型训练和推理,行业人士透露,训练方面仅可用于70亿-650亿参数模型,无法训练万亿级参数模型;推理方面4090D显卡就能稳稳运行。
微软将其小模型 Phi-2 更新为更宽松的 MIT 开源许可
微软日前将其于12月发布的27亿参数的小模型「Phi-2」的许可更新为更宽松的 MIT 开源许可,该许可证允许软件的商业使用、分发、修改和私人使用。
微软和OpenAI再被两位作者提起集体诉讼
据路透社报道,另外两位作者 Nicholas Basbanes 和 Nicholas Gage 已对 OpenAI 和微软提起集体诉讼。起诉书称,OpenAI 和微软“为帮助训练大模型大规模、蓄意地盗窃了作者创作的受版权保护的作品”。
OpenAI 声称纽约时报的提示策略违反了其服务条款
据 OpenAI 称,纽约时报的提示生成了《纽约时报》新闻内容的精确副本,违反了其语言模型的使用条款。根据此前纽约时报对OpenAI的起诉,纽约时报以原始文章的开头提示 GPT 模型,使得模型输出尽可能地接近完整的文章文本。OpenAI 知识产权和内容主管 Tom Rubin 表示,纽约时报故意利用这些操纵性提示来故意复制训练数据,违反了 OpenAI 的服务条款。
微软面向大型公司的商业版 Copilot 每年的费用至少为 10.8 万美元
Microsoft 365 商业客户可以访问 Copilot,但有一个问题:他们必须以每个用户每月 30 美元的价格购买至少 300 个个人许可证。这意味着 Word、Excel 和 PowerPoint 的 Copilot AI 商业订阅目前每年至少花费 108000 美元。
2024年1月6日·周六
英伟达将恢复中国“特供版”AI芯片出货
据台湾“中时新闻”网1月6日报道,据外媒报道,半导体制造商英伟达(NVIDIA)将恢复中国“特供版”AI芯片出货,目前美国对中国销售态度似乎有所软化,2024年第二季度将开始量产H20和其他AI芯片。
中国第三代自主超导量子计算机“本源悟空”正式上线运行
中国第三代自主超导量子计算机“本源悟空”今天9时上线运行。该量子计算机搭载72位自主超导量子芯片“悟空芯”,是目前中国最先进的可编程、可交付超导量子计算机。超导量子计算机是基于超导电路量子芯片的量子计算机。国际上,IBM与谷歌量子计算机均采用超导技术路线。
AI大模型首次牵手国民级综艺,昆仑万维天工AI联合《最强大脑》加速大模型落地
1月5日周五晚21:20,由昆仑万维「天工APP」特约赞助的《最强大脑》第11季正式播出。这是AI大模型技术与国民级综艺IP的首度深度合作,在节目中,「天工APP」将发挥其能搜、能聊、能写的多项超级AI大模型能力,与嘉宾选手深度互动,参与趣味脑力竞技环节,从而进一步推动大模型技术的普适应用,降低技术门槛,让越来越多的用户能够轻松、便捷地拥抱大模型。
微软副总裁 Dee Templeton 已加入 OpenAI 董事会担任无投票权观察员
据彭博社报道,一位知情人士透露,微软公司高管迪伊・坦普尔顿(Dee Templeton)已作为无投票权观察员加入 OpenAI 董事会,这是 OpenAI 首席执行官 Sam Altman 短暂罢免后的董事会改革的一部分。Dee Templeton是微软的一名副总裁,已经在微软工作了 25 年,领导一个团队负责技术和研究合作伙伴关系及运营。
2024年1月5日·周五
网信办公布第三批深度合成服务算法备案信息,含淘宝、抖音、网易等企业
据网信中国微信公众号消息,根据《互联网信息服务深度合成管理规定》,现公开发布第三批境内深度合成服务算法备案信息,具体信息可通过互联网信息服务算法备案系统(https://beian.cac.gov.cn)进行查询。AI工具集也将备案查询更新到最新的数据,感兴趣的朋友们可以访问 https://ai-bot.cn/beian-search/ 查看。
美国联邦贸易委员会悬赏 2.5 万美元,寻找可区分声音是否 AI 生成的方法
美国联邦贸易委员会(FTC)近日宣布悬赏令,寻找一种方法,可以区分声音是真实人类发出,还是 AI 生成的。FTC 表示参与者可围绕着以下三点展开:预防或认证、实时检测或监控、后续评估。比赛的总冠军将获得 25000 美元,亚军将获得 4000 美元,最多可颁发三个荣誉奖(每个干预点一个),每个奖金为 2000 美元。
美图宣布旗下AI视觉大模型MiracleVision(奇想智能)正式上线
1月5日,美图公司自研AI视觉大模型 MiracleVision(奇想智能) 正式上线,向行业客户、合作伙伴全面开放模型能力的同时,广大用户可在MiracleVision(奇想智能)官网和美图秀秀、 WHEE 等美图旗下产品中率先体验。
国家数据局等17部门:支持开展人工智能大模型开发和训练
日前,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》。其中提到,以科学数据支撑技术创新,聚焦生物育种、新材料创制、药物研发等领域,以数智融合加速技术创新和产业升级。以科学数据支持大模型开发,深入挖掘各类科学数据和科技文献,通过细粒度知识抽取和多来源知识融合,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练。
云从科技领投原小天才团队 ,“元生智能”完成千万级天使轮融资
近日,居家养老消费电子品牌「元生智能」获千万元天使轮融资。本轮融资由上市公司、国内AI四小龙云从科技战略领投,松山湖天使基金、广东省科学院珠海产研院、老股东星火教育创始人、老股东清荣创投跟投。据悉,本轮融资将用于产品生产、技术研发与迭代、市场营销推广以及新产品研发。元生智能成立于2022年,主要为65岁以上空巢、独居老人提供智能居家看护产品。
科研期刊《Science》宣布引入 Proofig AI 检测图像欺诈,避免学术造假
研究期刊《Science(科学)》今日宣布,正引入一项名为 Proofig 的商业 AI 软件,该软件号称能够自动检测论文中的“欺诈性图像”,以避免学术造假。《Science》期刊团队宣称已经利用 Proofig 软件进行了数月测试,这款 AI 软件据称能够准确识别经过裁剪、旋转、更改对比度的图像,并从中圈出可能存在“欺诈性”的图像,以便于人类编辑进一步检查。
Google DeepMind 推出一系列关于自主机器人训练的系统和模型的最新研究
Google DeepMind 推出了一系列先进技术和研究,可解决机器人技术中的关键挑战,例如自主数据收集、计算效率和任务泛化。这些新系统和技术(AutoRT、SARA-RT 和 RT-Trajectory)建立在 Robotics Transformers 基础模型上,旨在简化决策流程、增强对环境的理解并提高机器人的导航能力,展示了向更强大的辅助机器人迈出的步伐。
OpenAI 董事会据悉与 Scale AI 首席执行官等讨论填补席位空缺
在山姆·奥特曼(Sam Altman)重返OpenAI担任首席执行官后,OpenAI董事会及其代表已开始与候选人讨论填补董事会成员空缺。知情人士透露,候选人包括Scale AI首席执行官兼联合创始人亚历山大·王(Alexandr Wang)和前GitHub首席执行官兼初创企业投资人奈特·弗里德曼(Nat Friedman)。
引入 AI 取代外包翻译工,消息称语言学习平台多邻国已裁员数千人
语言学习平台多邻国(Duolingo)此前在全球各地雇佣了大量的外包翻译工,为自家软件翻译学习内容及用户界面。不过当前多邻国正逐步引入 AI 取代外包翻译工,Reddit 平台有用户发文声称该公司已裁去数千名员工,剩下的合同工日常内容也仅为审阅 AI 生成的内容,从而保证翻译质量。据悉,Reddit 平台上一位被辞退的合同工贴出了多邻国 HR 发给自己的辞退邮件,证实了多邻国正对“外包翻译工”动刀。
2023年冲出23家新晋AIGC独角兽:最高估值千亿,6家来自中国
根据智东西统计,2023年新晋的生成式AI和大模型领域相关独角兽达23家,国内新晋独角兽有6家,分别是智谱AI、MiniMax、百川智能、零一万物、智元机器人,以及已被收购的光年之外。这些独角兽企业涉及大语言模型、AI视频生成、垂直行业应用研发商以及GPU云服务提供商。其中估值高于50亿美元的独角兽有3家,被称作OpenAI劲敌的Anthropic,估值排名第一达到184亿美元,远高于排名第二GPU云服务提供商CoreWeave的70亿美元,Character.AI估值超50亿美元,排名第三。
OpenAI 计划下周推出 GPT 商店,可销售 / 共享定制聊天机器人
据 The Verge 报道,OpenAI 在给 GPT Builders 签约人员的电子邮件中表示,GPT Store 将于下周正式推出,用户可以在其中销售和共享基于 OpenAI 大型语言模型的聊天机器人(GPT)。开发者将“根据有多少人使用你的 GPT”来产生收入。
OpenAI 拟向媒体出版公司支付数百万美元的年费采买新闻许可以训练大模型
据 The Information 报道,有两名与 OpenAI 谈判的高管近日透露,OpenAI 已经向一些媒体公司开出了每年 100 万-500 万美元的价格,以获得将新闻内容用于训练自家大语言模型的授权许可。一位高管同时也称,苹果正试图在生成人工智能领域追赶 OpenAI 和谷歌,并试图与出版商就其内容的使用达成交易且出价更高。
消息称谷歌将推出 Bard 高级版付费服务,同 ChatGPT Plus 竞争
消息称谷歌计划推出其 AI 语言模型 Bard 的高级付费版本 ——Bard Advanced,类似 ChatGPT Plus 付费订阅服务。据悉,Bard Advanced 将在现有免费版本的基础上提供一系列额外功能和提升,主要包括:信息获取更广、回应质量的提升、优先处理速度。免费版 Bard 预计将继续保留,谷歌计划提供限时免费试用,让用户在付费之前体验 Bard Advanced 的强大之处。
消息称苹果 Siri 融入生成式 AI 取得进展,将带来更自然的对话和个性化体验
据 Naver 知名科技新闻聚合账号 yeux1122 透露,苹果在将自研的 Ajax 生成式 AI 模型应用于 Siri 方面取得了重大进展,预计会在今年的 WWDC 上展示。彭博社记者 Mark Gurman 早在去年 7 月就曾提及 Ajax 模型的存在。新版 Siri 据称将具备更自然的对话能力,并提供更加个性化的用户体验。
2024年1月4日·周四
统信 UOS 与讯飞星火在 AI 等领域达成战略合作,推出浏览器和邮箱助手
近期,在 2023 操作系统产业大会暨统信 UOS 生态大会上,科大讯飞与统信软件宣布达成战略合作。讯飞星火将支持 UOS AI 浏览器助手,集成“聊天问答、自定义 AI 提示词和快捷浮窗”三大核心功能,用户可定制代码解释器、法律顾问、英语教练等功能。此外,讯飞星火将支持 UOS AI 邮箱助手,可以实现邮件智能回复、自动解释、多语言翻译 / 转写、自动生成主题、总结等能力。
两部门:加强云计算、人工智能、大数据等在应急机器人中的创新应用,提升机器人智能化水平
应急管理部、工业和信息化部发布关于加快应急机器人发展的指导意见,提升机器人控制及智能化水平。针对复杂有限空间、高山峡谷、激流水域等特殊环境救援需求,加强无通信讯号、高浓度烟尘、地形条件复杂、水域浑浊流速快等极端恶劣条件下的机器人环境自适应、多源信息融合、任务策略智能规划、自主智能侦察搜索等技术研究。突破无人机、机器人等装备集群协同作业关键技术,以及人机协同作业技术。加强云计算、人工智能、大数据等在应急机器人中的创新应用,提升机器人智能化水平。
AI小冰入驻淘宝,将提供虚拟人陪伴服务
据悉,小冰在淘宝开出了“小冰旗舰店”、以及手淘小程序“X Eva 克隆人的平行世界”,为消费者提供基于KOL虚拟人带来的陪伴服务体验。用户搜索“小冰旗舰店”就可以直达店铺进行选购。
微软改变PC电脑键盘,将新增人工智能Copilot按键
微软希望 2024 年成为“人工智能 PC 年”,并以对新笔记本电脑和 PC 上的键盘进行重大更改来拉开帷幕。新的 Copilot 键将配备在 Microsoft 合作伙伴提供的各种新型 PC 和笔记本电脑上,只需按下键盘按钮即可快速访问微软人工智能驱动的 Windows Copilot 体验。
商汤科技发布首款智能台灯“元萝卜光翼灯”
商汤科技日前在北京召开以“不止于光”为主题的新品发布会,会上推出旗下智能台灯产品——元萝卜光翼灯。该产品主要面向学龄儿童,覆盖书桌学习场景,护眼标准优于国家AA级认证指标、全光谱、模仿自然光,具备Rg0豁免级防蓝光效果等优势,创新融合了领先的人工智能技术,实现AI纠正坐姿提醒、AI专注力检测、AI光随书动等特色智能功能,帮助孩子们预防近视和脊椎侧弯等健康问题,享受智能时代健康、轻松的学习成长体验。
阿里云通义千问APP上线免费功能“通义舞王”
阿里云通义千问APP上线免费功能“通义舞王”,用户在通义千问APP内输入“通义舞王”“全民舞王”等口令后,即可进入体验页面。用户按照提示要求上传照片后,十几分钟即可生成神形兼备的舞蹈视频。目前,通义千问首批为用户提供了12种热门舞蹈模板。该功能背后的算法为阿里通义实验室自研视频生成模型Animate Anyone。
小冰公司宣布获得大模型备案,小米、OPPO 等“召唤小冰”功能将切换服务
小冰公司今天宣布,已于去年 12 月成功获得“小冰大模型”国内备案,小冰已实现不同参数规模和用途的自研大模型产品落地,部分完成新范式商业化验证。因此,今天起结束静默期,宣布将一系列测试产品转为正式发布。
马斯克称比亚迪与特斯拉没有可比性:我们是AI/机器人公司
据参考消息援引美国《华尔街日报》网站1月3日报道,中国汽车制造商比亚迪的纯电动汽车季度销量首次超过特斯拉,成为全球最大的电动汽车销售商。特斯拉CEO埃隆·马斯克在与多位X用户的互动中,对比亚迪去年销量超过特斯拉的消息进行了回应,认为两家公司没有可比性,因为特斯拉的定位是一家人工智能+机器人公司,而不仅仅是一家汽车公司。
网易有道推出子曰教育大模型2.0
日前,网易有道举办“子曰”教育大模型创新成果发布会。在发布会上,网易有道宣布推出国内首个教育大模型“子曰”2.0版本,同时还发布了基于大模型研发的三大创新应用及一款智能硬件新品。
瑞银预计2027年人工智能市场规模达2250亿美元,平均每年增长152%
瑞银集团在周二发布的一份报告中表示,科技行业才刚刚开始大规模增长周期,到2027年,人工智能在各经济体的广泛应用将使其成为一个2250亿美元的市场。与2022年的22亿美元相比,这是一个巨大的飞跃,标志着近152%的复合年增长率。
英特尔成立新AI软件公司,专为企业客户提供生成式软件
美国当地时间周三,英特尔宣布,在数字资产管理公司DigitalBridge Group和其他投资者的支持下,该公司将围绕人工智能(AI)软件业务组建一家新的独立公司。这个新实体不会公开上市,将被命名为Articul8 AI,它最初是英特尔与波士顿咨询集团(Boston Consulting Group)合作开展企业人工智能技术项目的产物。
2024年1月3日·周三
科技部发文规范 AI 使用,禁用 AIGC 直接生成申报材料
科技部监督司上个月编制印发《负责任研究行为规范指引(2023)》,《指引》从研究选题与实施、数据管理、成果署名、同行评议、伦理审查、监督管理等 11 个方面,对科研人员和科研机构、高等学校、医疗卫生机构、企业等,提出了开展负责任研究应普遍遵循的科学道德准则和学术研究规范。《指引》提出不得使用生成式人工智能直接生成申报材料,不得将生成式人工智能列为成果共同完成人,同时强调科研人员应把科技伦理要求贯穿到研究活动的全过程。
deepin 深度操作系统推出“看图 AI 插件”,支持设备端“图像上色”“转换风格”等 8 大功能
deepin 深度操作系统近日推出了一款“看图 AI 插件”,用户在安装后即可在设备端体验 8 种“AI 修图”功能:图像上色、提升分辨率、模糊背景、删除背景、手绘漫画、2D漫画、3D漫画、素描。
Midjourney 计划未来几个月内发布 AI 视频生成模型
Midjourney 是一个流行的图像生成工具,因其高质量和在 Discord 服务器内运行而闻名。该公司周二宣布,他们计划在未来几个月内推出“文本转视频”模式。Midjourney 首席执行官 David Holz 在 Discord 对话上表示,该公司将从一月份开始训练其视频模型,可能会在“几个月内”准备就绪。有关该模型的更多信息并未透露。
IDC、钉钉联合发布 2024 AIGC 应用层十大趋势
1 月 3 日,钉钉联合国际知名咨询机构 IDC 发布首份《2024 AIGC 应用层十大趋势白皮书》(下称《白皮书》)。随着 AIGC 技术的发展,智能化应用将呈现爆发式增长,IDC 预测,到 2024 年全球将涌现出超过 5 亿个新应用,这相当于过去 40 年间出现的应用数总和。
由原钉钉副总裁创立的AI Agent初创公司斑头雁智能科技获亿元融资
人工智能公司斑头雁智能科技近日完成近千万美元A轮融资,用于继续深入打造企业级AI Agent(人工智能代理)产品BetterYeah AI。斑头雁智能科技目前累计完成2轮融资,融资额合计人民币1亿元。斑头雁智能科技在杭州注册成立已有两年时间,由钉钉创始团队成员、原副总裁张毅(花名陶钧)创立。
消息称英伟达正开发“Skinny Joe”AI GPU:700W TDP,特供中国
根据国外科技媒体 tweaktown 报道,英伟达正开发名为“Skinny Joe”的全新 AI GPU,预估为中国特供版本,其 TDP 为 700W。根据曝光的参考 Dev_ID 列表,“Skinny Joe”仅次于新款 L20 AI GPU 和英伟达(NVIDIA)GeForce RTX 4090 D 显卡。目前尚不清楚“Skinny Joe” AI GPU 的具体规格信息,不过预估可能是 H100 或者 H200 的“瘦身”版本。
微软移动端 Edge 浏览器名称变更,加入“AI”字样
近日,用户发现微软将其安卓和 iOS 平台的移动浏览器从“微软 Edge”改名为了“微软 Edge:AI 浏览器”,强调了其目前最重视的 AI 领域。除了新的名字,该浏览器在 App Store 和 Google Play Store 的介绍中也宣传了新的人工智能功能,如 DALL-E 3 图像生成器、Copilot 文章摘要、图像识别等。此外,该介绍还强调了对 GPT-4 的支持,称微软 Edge 是“你的人工智能浏览器”。
2024年1月2日·周二
诺贝尔奖得主警告:人工智能兴起将严重冲击STEM领域的就业
2010年诺贝尔经济学奖得主、伦敦政治经济学院经济学教授克里斯托弗·皮萨里德斯指出,目前从事某些IT工作的人员有可能通过推进人工智能的进步,为自己的职业埋下“自我毁灭的种子”,因为人工智能最终将在未来取代这一类型的工作。他警告年轻一代不要一拥而上地学习科学、技术、工程和数学(STEM)专业,人工智能时代的到来将对这些领域产生严重冲击。
聆心智能 CharacterGLM 大模型通过备案,面向公众开放
聆心智能日前在官方微信公众号发文表示其研发的 CharacterGLM 大模型通过国内第三批上线备案许可,于2024年1月1日正式面向大众提供服务。聆心智能孵化自清华大学,致力于打造新一代“安全、可控、拟人”的超拟人大模型并建立相关应用生态。
北大与智元机器人正式成立联合实验室
据北京大学新闻网,“北大-智元机器人联合实验室”正式成立。北大-智元机器人联合实验室将在解决关键具身智能技术问题的同时,培养领域内的国际顶尖技术人才。智元机器人由“华为天才少年”彭志辉(稚晖君)等来自多家大厂的科技人才联合创立,于2023年12月完成新一轮融资。
网易有道词典公布2023年度词汇:Prompt
网易有道词典官方发布2023年度词汇:Prompt(释义:提示词)。基于有道词典9亿用户全年的搜索数据,“Prompt”查询量荣登榜首,在有道词典中增长了惊人的1872%,成为2023年度词汇。这个词汇的中文解释是“提示词、大模型的指令”。
Meta等推出全新AI视频生视频模型FlowVid
来自得克萨斯大学奥斯汀分校和Meta GenAI团队成员,提出了一个能够保持一致性的V2V(视频到视频)合成框架——FlowVid。仅需1.5分钟,就能生成一段4秒,每秒30帧、分辨率为512×512的视频。与此同时,FlowVid能够无缝与现有I2I模型配合,支持多种修改方式,包括风格化、物体替换和局部编辑。
美图AI视觉大模型MiracleVision(奇想智能)通过备案,将向公众开放
美图公司宣布其自研AI视觉大模型 MiracleVision(奇想智能) 通过《生成式人工智能服务管理暂行办法》备案,将面向公众开放。美图AI视觉大模型MiracleVision(奇想智能)于2023年6月内测,为美图秀秀、美颜相机、 Wink 、美图设计室、 WHEE 、美图云修等知名影像与设计产品提供AI模型能力的同时,也帮助美图公司搭建起由底层、中间层和应用层构建的人工智能产品生态。
华为团队改进 Transformer 推出盘古-π架构,性能超LLaMA
华为诺亚方舟实验室等联合推出新型大语言模型架构:盘古-π。它通过增强非线性,在传统Transformer架构上做出改进,由此可以显著降低特征塌陷问题,带来的直接效果就是模型输出表达能力更强。在使用相同数据训练的情况下,盘古-π(7B)在多任务上超越LLaMA 2等同规模大模型,并能实现10%的推理加速。在1B规模上可达SOTA。同时还基于这一架构炼出了一个金融法律大模型“云山”。
清华 & 哈佛团队推出 LangSplat:更准确描述 3D 场景、比 LERF 快 199 倍
清华大学携手哈佛大学,共同开发了名为 LangSplat 的全新 AI 系统,能够在三维空间内高效、准确地搜索开放式词汇。LangSplat 是第一个基于 3DGS 的 3D 语言场方法,特别引入了 SAM 和 CLIP,在开放词汇 3D 对象定位和语义分割任务上优于最先进的方法,同时比 LERF 快 199 倍。
周鸿祎预测2024年行业趋势:AI 大模型不会被巨头垄断,新的“杀手级”应用有待观望
360集团创始人、董事长周鸿祎表示,目前中国的大模型没有一家能够遥遥领先、一统江湖。同时,我们需要承认,美国在 AI 方面还是比中国领先。AI 是属于全人类的技术,因此 AI 的快速发展会对中国有很大的帮助。
美国首席大法官:AI会改变法院运作方式,但无法取代人类
美国第17任美国首席大法官约翰·罗伯茨(John Roberts)表示,人工智能(AI)将改变美国法院的运作方式,不过人类法官还将存在“一段时间”。罗伯茨在其2023年年终报告中表示,人工智能工具将改变法官的工作方式,以及他们如何理解“人工智能在他们面前的案件中所扮演的角色”。
GPT-5不会真正突破,24年AGI不会实现!全网AI大佬24年最全预测
经过 23 年的生成式 AI 之年,24 年 AI 会有哪些新突破?大佬预测,即使 GPT-5 发布,LLM 在本质上仍然有限,在 24 年,基本的 AGI 也不足以实现。
ChatGPT 产品增长强劲,消息称 OpenAI 年化收入超 16 亿美元
12 月 31 日消息,The Information 援引两位知情人士的话称,由于 ChatGPT 产品的强劲增长,OpenAI 最近的年化收入超过了 16 亿美元,高于 10 月中旬预期的 13 亿美元(当前约 92.43 亿元人民币),在两个月内实现了 20% 的增长。
2023年12月29日·周五
Canalys:明年AI手机出货量预计达6000万部,2024年或迎AI终端元年
日前,全球著名的科技市场独立分析机构Canalys发布对智能手机市场的最新预测。预测显示,2024年,智能手机总出货量中,或将有不到5%为AI手机,这意味着AI手机的出货量将达到6000万部。
分析师:人工智能未来可期,但苹果却“掉队”了
2023年,在生成式人工智能(AI)模型的推动下,科技行业呈现增长之势。市场研究公司TECHnalysis Research总裁Bob O’Donnell认为,现在AI只是一个开始,微软和Alphabet等公司未来将出现爆炸式增长。不过他称,苹果似乎“落后于曲线”。
优必选宣布港交所挂牌上市,成为“人形机器人第一股”
深圳市优必选科技股份有限公司(简称“优必选”)今日宣布在香港地区联交所主板挂牌上市,成为“人形机器人第一股”。据优必选官网介绍,优必选科技成立于 2012 年 3 月,是全球领先的人工智能和人形机器人研发、制造和销售为一体的高科技创新企业。
「桥田智能」获美的资本数千万战略投资,提供多种工业机器人执行端解决方案
机器人末端执行设备服务商「桥田智能」日前完成数千万A轮融资,投资方为美的资本。本轮融资资金将用于产品研发、市场开拓及产业链建设。桥田智能成立于2016年,专注于机器人末端快换装置,快换产品于2020年起陆续进入主流主机厂,并获得TÜV、CE、ISO等行业权威机构认证。
八部门:探索建设区域人工智能数据处理中心,促进人工智能赋能传统制造业
工业和信息化部等八部门关于加快传统制造业转型升级的指导意见,其中提到,到2027年工业企业数字化研发设计工具普及率、关键工序数控化率分别超过90%、70%。探索建设区域人工智能数据处理中心,促进人工智能赋能传统制造业。
OpenAI员工:提示词工程技能被夸大,学会和人打交道更重要
本周早些时候,OpenAI的开发者倡导者洛根·基尔帕特里克(Logan Kilpatrick)在X平台上写道:“热门观点:现在有很多人认为,为了在未来保持竞争力,必须掌握提示词工程技能。但事实上,提示人工智能系统和与他人进行有效沟通并没有本质的区别。”
消息称阿里云削减政企定制项目和 IoT 硬件集成业务,扩大 AI 部门招聘
据《晚点 LatePost》报道,阿里云正在裁减为政企客户定制行业解决方案的项目制业务,并在 IoT(物联网)业务线砍掉硬件集成业务并缩减相关人员。其中,混合云事业部部分团队裁员比例达到 30%。IoT 硬件集成业务裁员比例超 50%,该部门剩下的人员将被打散并至其他业务。同时,阿里云正扩大公共云事业部和 AI 部门的招聘。
雷鸟推出 RayNeo AI 大模型语音助手:已于旗下 X2 AR 眼镜展开内测
据“雷鸟 XR”官方公众号,雷鸟昨日推出一款 RayNeo AI 大模型语音助手,目前已经在旗下 X2 AR 眼镜中展开内测,据称“唤起语音助手即可使用”,能提供自然语言对话、行程规划、百科问答、查询天气等能力。来源: IT之家
覆盖97.6%泌尿就医人群,蚂蚁集团开源首个医疗专科推理数据集
由信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,这将提升大模型在医疗领域的专业性。
2023年12月28日·周四
百度 CTO 王海峰:文心一言用户数已突破 1 亿
在今日下午的百度 WAVE SUMMIT + 深度学习开发者大会 2023 上,百度首席技术官王海峰宣布,目前文心一言的用户累计数量已经超过 1 个亿,每天用户的日提问量正在快速提升。
Meta 首席科学家杨立昆:OpenAI 已沦为微软的“合同研究机构”
Meta 首席 AI 科学家杨立昆(Yann LeCun)日前接受《连线》杂志采访,对萨姆・阿尔特曼掌舵的 OpenAI 进行了猛烈抨击。杨立昆直言,OpenAI 已偏离了最初设定的非盈利道路,且沦为了微软的“合同研究机构”。“现在,他们基本上是微软的合同研究机构,尽管他们有一定的独立性。”
AI芯片公司「鲲云科技」获数亿元C轮融资,由普罗资本领投
深圳鲲云信息科技有限公司(以下简称「鲲云科技」)宣布完成数亿元C轮融资。此轮融资由普罗资本领投,鼎晖百孚、联通旗下联创基金、张科垚坤基金、钟楼金控集团跟投。本轮资金主要用于支持下一代可重构数据流CAISA AI芯片的研发和规模落地,构建CAISA芯片在各垂直行业的产业化生态。
艾伦人工智能研究院创始CEO:AI成本每18个月就下降一半,明年多模态时代将至
美国艾伦人工智能研究院创始CEO、现董事会成员兼顾问奥伦·伊奇奥尼博士在接受每经网的专访时对记者表示,2024年的AI发展趋势是多模态大模型的进一步研发,同时超越单纯的内容生成,向能够完成行动的AI智能体前进。此外,芯片时代的摩尔定律在AI时代仍然适用,AI的训练和推理成本可能每18个月就下降一半。
澜舟科技通过生成式人工智能备案并发布新版孟子GPT-金融模型和孟子GPT-Code模型
澜舟科技日前在官方公众号宣布已于26日正式通过国家互联网信息办公室颁布的《生成式人工智能服务管理暂行办法》备案,后续将很快向公众发布孟子大模型及其核心能力。此外,澜舟科技现正式发布孟子GPT-金融-13B大模型和澜舟的第一款代码助手大模型:孟子GPT-Code-6.7B大模型。
优酷上线对话式影视搜索工具“AI 搜片”:可模糊搜索 / 询问影片剧情
优酷视频今天宣布上线一项新功能“AI 搜片”,号称是全网首个 AI 对话类影视搜索引擎。据介绍,该功能号称覆盖全网百万级影视剧实体信息,融合万亿条文娱相关知识词条,可通过多轮对话来实现模糊搜索、影视问答、剧情检索等功能,不需要具象化的问题就能完成。
李开复:中国大模型竞争异常激烈,最终将有几个大赢家
根据风险投资家、谷歌中国前总裁李开复的预测,中国的生成式人工智能创业公司正在经历一场“预选赛”。他预测:“在中国,最终将有几家大赢家崭露头角,部分公司可能会体面地退出市场。但大多数企业要么半途而废,要么转向更为实际的目标,如为特定行业构建应用和解决方案”。
《纽约时报》起诉OpenAI和微软,称其文字作品版权遭到侵犯
美国最具影响力的媒体之一《纽约时报》起诉OpenAI和微软,指控两家公司侵犯其文字作品版权。《纽约时报》在纽约南区的美国联邦法院提起了诉讼,该公司要求对这起诉讼进行陪审团审判。
2023年12月27日·周三
AI或迎大突破!新型类脑晶体管能模拟人类智能,可在室温下工作
受人类大脑的启发,美国研究人员开发了一种新的突触晶体管,能够进行更高层次的思考。该设备由西北大学、波士顿学院和麻省理工学院(MIT)的研究人员设计,可以像人脑一样同时处理和存储信息。在新的实验中,研究人员证明,晶体管超越了简单的机器学习任务,可以对数据进行分类,并且能够进行联想学习。
华为云 CodeArts Snap 智能开发助手正式开启公测
华为云 CodeArts Snap 智能开发助手将于明日正式开启公测,CodeArts Snap是基于华为云研发大模型开发的,覆盖软件开发全生命周期端到端的智能开发助手。它具备代码生成、研发知识问答、单元测试用例生成、代码解释、代码注释、代码调试、代码翻译、代码检查八大核心功能。
OPPO Find X7 系列手机首搭 70 亿参数 AndesGPT 端侧大模型,小布助手全新升级
在今日下午的 OPPO Find X7 系列产品技术沟通会上,OPPO 公布了安第斯大模型 AndesGPT 的全新升级。安第斯大模型将分成 1800 亿参数、700 亿参数、70 亿参数三种体量,支持端云协同部署,根据不同场景的用户需求实现智能调度。通过 4bit 量化的模型压缩,OPPO 的 Al Boost 推理引擎优化,以及与芯片厂家联合深度优化等多项举措,OPPO 在 Find X7 系列上首次实际端侧应用 70 亿参数的大模型。
图灵奖得主Yann LeCun最新专访:AI将接管世界,但不会征服人类
作为图灵奖得主和 Meta 首席 AI 科学家,Yann LeCun 是 AI 技术最有力的捍卫者之一。LeCun 近日在接受美国数字媒体 WIRED 的访谈中表示,在他看来,AI 必定会改变世界,但这并不意味着它会统治人类。
上海AI实验室升级发布“浦医2.0”,实现医疗大模型群一站式开源
近日,在“2023健康中国思南峰会”上,上海人工智能实验室(上海AI实验室)与上海交通大学医学院附属瑞金医院等合作伙伴联合发布医疗多模态基础模型群“浦医2.0”(OpenMEDLab2.0),旨在为“跨领域、跨疾病、跨模态”的AI医疗应用提供能力支持。
联想天禧AI生态个人智能体小乐同学亮相,为开发者AI转型赋能
联想天禧AI生态伙伴大会以天禧AI技术架构赋能生态,升级“四端一体”战略,通过端云混合大模型为行业带来了新思考,个人智能体小乐同学的首度亮相也为开发者带来新的价值赋能。
马斯克旗下 AI 创企 xAI 采用特殊结构,优先考虑对社会影响
特斯拉首席执行官埃隆・马斯克(Elon Musk)新成立的 AI 初创公司 xAI 正在效仿竞争对手 OpenAI 和 Anthropic 的做法,选用了一种与众不同的公司结构。xAI 在 11 月底向内华达州提交的文件显示,该公司已经注册为营利性共益企业,这种结构允许公司优先考虑对社会的积极影响,而非对股东的回报。
消息称iPhone设计负责人将加盟苹果前首席设计师的公司,与 Altman 合作开发AI产品
据知情人士称,苹果前首席设计师乔纳森·伊夫(Jonathan Ive)和OpenAI首席执行官萨姆·奥特曼(Sam Altman)正联手延揽苹果iPhone和Apple Watch设计负责人Tang Tan参与一项新的人工智能(AI)硬件开发计划,目的是要打造具有AI最近功能的新产品。
OpenAI竞争对手Anthropic预计明年年化营收将达到8.5亿美元,远高于此前预测
据两位知情人士透露,OpenAI的竞争对手、亚马逊和谷歌投资的AI初创公司Anthropic预计,到2024年底,其年化收入将超过8.5亿美元。就在三个月前,Anthropic告诉一些投资者,公司的年化收入为1亿美元,预计到2024年底,这一数字将达到5亿美元。目前尚不清楚为什么最新的预测要高得多。这一预测突显了这家成立仅三年的初创公司令人瞩目的增长预期,并可能提供更多证据表明,生成式人工智能正在企业中获得动力。
2023年12月26日·周二
OpenAI 早期投资者:未来25年人工智能将产生巨大的通缩效应
OpenAI 早期投资者、美国知名企业家和风险投资家、太阳微系统公司联合创始人 Vinod Khosla 表示,他预计人工智能将改变全球经济。Khosla 在 X 上写道:人工智能在25年内应该会产生巨大的通缩效应。在一段时间内,资本应该是稀缺的,目前衡量GDP和经济的指标将不那么重要,但商品和服务应该非常丰富。关键问题是什么是正确的措施和正确的问题。
AI芯片独角兽燧原科技增资至1亿元,腾讯持股21.37%为第一大股东
天眼查App显示,12月25日,上海燧原科技股份有限公司发生工商变更,注册资本由约443万人民币增至1亿人民币。该公司成立于2018年3月,创始人、董事长兼CEO为赵立东,主要提供AI训练和推理产品,涵盖芯片、板卡、智算一体机、液冷算力集群以及配套的软件系统。天眼查的股东信息显示,该公司由腾讯科技(上海)有限公司、赵立东、张亚林、国家集成电路产业投资基金二期股份有限公司等共同持股。其中,腾讯科技(上海)有限公司持股约21.37%,为第一大股东。
中国信通院发布《人工智能伦理治理研究报告(2023年)》
中国信息通信研究院在“2024中国信通院ICT深度观察报告会”科技伦理治理分论坛上发布了 《人工智能伦理治理研究报告(2023年)》 。报告在总结人工智能伦理治理有关概念和特点的基础上,对人工智能生成内容、自动驾驶、智慧医疗三个典型应用场景的伦理风险进行分析,并结合国内外人工智能伦理治理实践,提出人工智能伦理治理的四点展望,以期为更加广泛深入的讨论提供参考。
2023年度十大科技名词揭晓,大语言模型、生成式人工智能等入选
“2023年度十大科技名词”在京发布,由全国科学技术名词审定委员会事务中心联合国家语言资源监测与研究平面媒体中心、蜜度微热点研究院、万方数据、百度百科、百度指数、《中国科技术语》杂志社等多家机构联合发起。“大语言模型、生成式人工智能、量子计算、脑机接口、数据要素、智慧城市、碳足迹、柔性制造、再生稻、可控核聚变”入选。
vivo WATCH 3 即将上线 AIGC 表盘功能,搭载蓝河操作系统
vivo WATCH 3 智能手表于 11 月 13 日正式发布,这是 vivo 首款搭载蓝河操作系统的手表。据 vivo 官方消息,vivo WATCH 3 即将上线 AIGC 表盘功能,12 月底正式开启 OTA 推送,届时用户可以在 AI 加持下自定义表盘图案。
谷歌推出 Google AI SDK,简化在安卓应用中集成高性能模型 Gemini Pro
谷歌近日推出了全新的 Google AI SDK,旨在简化 Android 应用集成其高性能的 Gemini Pro 模型。借助该 SDK,开发人员无需构建和管理自己的后端基础架构。
AI鉴定二手奢侈品真伪,相关公司称准确率达99.1%
奢侈品鉴定机构Entrupy利用人工智能技术鉴定各种名牌手包和运动鞋,确保客户所购买的是真品。该公司声称,其人工智能技术对主流品牌奢侈品的检测准确率能达到99.1%。
文生视频软件 Pika 1.0 今日内向所有用户开放网页端访问
近日,文生视频公司 Pika 推出 Pika 1.0 ,其能够生成和编辑 3D 动画、动漫、卡通和电影等各种风格的视频,一经推出便在各大社交媒体上迅速走红。今日凌晨,Pika 团队在社交平台 X 上宣布 Pika 1.0 网页端访问权限将在今天内向所有用户开放,而且这个阶段是所有用户都可以免费使用的。
Moonshot AI 聊天机器人 Kimi Chat 更新,搭载新模型、支持扫描版 PDF 等
国内人工智能初创公司 Moonshot AI 宣布对其聊天机器人 Kimi Chat 进行更新,包括:1.新版本 moonshot-v1-20231225 模型发布;2.首字回复速度提升;3.支持扫描件文件识别;4.小程序:Kimi 智能助手上线;5.网页端浅色模式上线;6.圣诞小彩蛋。
英伟达借AI热潮,2023财年收入预计将超越三星和英特尔
在人工智能热潮席卷2023年之际,半导体行业终于将迎来三十年来的新王者——AI芯片领军者英伟达。据预测,英伟达2023财年收入料同比翻一倍,而三星、英特尔同期收入预计同比下滑,此消彼长之下,英伟达预计将夺走芯片市场的王冠。
谷歌介绍“交通疏导”AI 模型研究成果:平均缩短 7 分钟拥堵时间、提升 30% 交通效率
谷歌研究院日前发文,介绍了一项利用开源模拟软件 SUMO(Simulation of Urban Mobility)打造的“交通疏导”AI 模型应用成果。谷歌研究人员与美国西雅图交通部合作,在 2023 年 8 月及 11 月在多项大型活动中实际应用了这项交通疏导 AI 模型,配合“动态引导显示屏(Dynamic Message Signs)”,平均缩短了 7 分钟拥堵时间,成功提升 30% 交通效率。
2023年12月25日·周一
夸克App升级健康搜索,推出健康大模型应用“夸克健康助手”
夸克App宣布全面升级健康搜索,推出健康大模型应用“夸克健康助手”,并在部分搜索结果和功能板块中上线全新的内容交互方式。升级后,用户在夸克中搜索健康信息的正确率超过行业平均水平,多样化的信息呈现方式和优质搜索内容将更加便捷和实用。
昆仑万维「天工SkyAgents」智能体平台 Beta 版开启全网测试
昆仑万维AI Agents开发平台「天工SkyAgents」Beta版正式开放测试,该平台基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个“私人助理”,并能将不同任务模块化,通过操作系统模块的方式,实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http请求等任务。
郭明錤:AI PC / 手机等设备将成用户未来数年换机关键需求
天风国际分析师郭明錤今天中午在 Medium 平台发表最新一期报告 ——《2024 年消费电子产业三大关键投资趋势:Android 库存回补、Vision Pro 与 AI PC / 手机》。在“AI 设备、PC、手机为未来数年换机需求关键”这一小节中,郭明錤提出,从建立用户对AI设备认知、建立使用者行为与第三方开发商支持的角度来看,在相关从业者中(操作系统、软件服务、终端品牌、处理器与零部件),操作系统从业者对AI设备趋势的影响力最大。
旷视提出支持文档级 OCR 的多模态大模型 Vary,支持中英文
想将一份文档图片转换成Markdown格式?以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤。由来自旷视的研究团队推出多模态大模型Vary,只需输入一句话命令,直接端到端输出文档结果。
马斯克回应Grok失控:都被网友带坏了,测试阶段会持续改进
中立、敢于直言,是“马斯克版 ChatGPT”聊天机器人 Grok 一直在宣传的卖点。但最近网友们发现它的回答越来越带有倾向性,忍不住发帖吐槽,还 @上了马斯克本人。马斯克回复吐槽用于训练Grok的互联网信息过于繁杂,充斥着“带有唤醒色彩的垃圾信息”,相当于间接承认了网友们的说法。同时,马斯克也表示:现在的Grok只是个测试版,以后会变好的。
百度发布 2023 年度沸点榜单:生成式 AI 等入选科技热词根据百度发布的沸点年度榜单,2023 年度的“年度大事件”是杭州亚运会,而淄博烧烤则成为“年度关键词”,全红婵和张颂文分别当选为“年度人物”。“年度科技热词”包括了 AI 大模型、数字经济、中国空间站、量子计算机、生成式 AI、数字孪生、提示词工程师、悬挂式单轨列车、室温超导和脑机接口。 微软必应聊天引入 GPT-4 Turbo 模型,部分用户已可免费使用据 Windowslatest 报道,微软必应聊天的 GPT-4 Turbo 模型近日向部分随机选中的用户免费开放,该模型基于 OpenAI 的最新人工智能技术,能够提供更智能、更流畅、更有趣的聊天体验。此外,微软还计划升级必应聊天的代码解释器功能,使其与 OpenAI 的能力保持一致,这意味着代码解释器将能够处理更复杂的编程或数据问题。 抖音测试“AI搜”功能,加码智能搜索抖音正在主APP内测试AI搜索功能,名为“AI搜”,用户可以在该功能下获得AI提供的回答。通过体验可以发现,“AI搜”位于抖音APP的搜索界面内,与商品(抖音电商)、团购(抖音生活服务)、用户、视频等服务位于同一权重的位置。在“AI搜”内,用户可以搜索相关的问题和信息,“AI搜”为用户通过智能搜索进行总结。 小红书内测AI聊天机器人“达芬奇”小红书在主APP中内测了一个名为“Davinci”(达芬奇)的AI功能,“Davinci”可以为用户提供智能问答等AI聊天功能。该功能从9月份开始测试,持续到现在,这也是继AI群聊后,又一项新的AI应用。 AI筛选发现全新抗生素,为应对耐药性问题带来希望美国麻省理工学院布罗德研究所和哈佛大学科学家借助人工智能(AI)的力量,通过筛选数百万种化合物,发现了一类全新的抗生素。这类抗生素能杀死两种不同类型的耐药细菌,为应对全球性的抗生素耐药性挑战带来了新希望。相关论文发表在新一期《自然》杂志上。 OpenAI CEO 晒网友新年愿望清单:通用人工智能(AGI)、GPT-5 等呼声最多时值圣诞季,OpenAI 首席执行官 Sam Altman 化身“圣诞老人”在自己的 X 平台账号上发文征求网友们 2024 年对 OpenAI 的愿望与期待:“你希望 OpenAI 明年新增或修复哪些功能?”。不久之后,阿尔特曼公布了网友们呼声最多的项目如下:AGI(请稍微耐心一点)、GPT-5、语音模式表现更好、更高的速率限制、性能更强的 GPTs、更好的推理能力、对觉醒程度 / 行为程度进行控制、视频功能、个性化设置、更好的浏览体验、“使用 OpenAI 账号登录”、开源。 |
2023年12月24日·周日
AI 侵袭广告部门,谷歌员工担忧人工智能抢饭碗
谷歌近期正考虑利用人工智能(AI)工具来提高内部效率,此举引发了公司内部员工的担忧,担心他们会被人工智能取代而失业。这种担忧加剧的原因之一是,谷歌计划对广告销售业务进行重组。尽管公司并未明确表示将裁员,但“重组”一词在许多情况下往往意味着裁员或岗位调整,这让员工们更加忐忑不安。
Sam Altman 年终思考总结 17 条短句
OpenAI CEO Sam Altman 日前将他的年终思考总结为17条经验,起了个标题叫《我希望有人早点告诉我这些》,希望这对正在思考2024年该做什么的人们有帮助。英文原文: https://blog.samaltman.com/what-i-wish-someone-had-told-me
谷歌联合创始人 Sergey Brin 下场给 Gemini 贡献代码
据报道,身价1050亿美元的谷歌联合创始人谢尔盖·布林(Sergey Brin)出现在 Gemini 大模型的核心贡献者名单中。千亿富翁大老板亲自下场敲代码已是少见,更何况频率是“几乎每天”,这事儿在X(原Twitter)上一经发布,即刻引来众多网友关注。Perplexity AI 和 Stabiity AI 的 CEO 都曾透露 Brin 位居科研第一线探讨技术问题。
窦德景:国内大模型达到GPT-3.5水平,与GPT-4技术差距在缩小
在2024环球时报年会-议题四“创新、科技与人文:中国式现代化的未来图景”的讨论中,著名人工智能和大数据专家,清华大学电子工程系兼职教授窦德景表示,国内大模型目前达到GPT-3.5水平,离GPT-4还有一定差距,但差距在缩小。
Humane 推出的可穿戴人工智能设备 AI Pin 将于明年3月开始交付
周五,美国初创公司Humane官方在X平台发文表示:我们非常高兴地宣布,Ai Pin将于2024年3月开始发货。此外,Humane还补充道,将根据购买日期发货,优先下单的用户将优先获得设备。
信通院发布2024信息通信业十大趋势:5G增强技术、AI大模型成热点
日前,中国信息通信研究院发布了2024信息通信业(ICT)十大趋势。官方表示,面向2024年,ICT技术将广泛、深度融入制造业各环节,推进新型工业化发展;在人工智能大模型驱动下,智能算力、算力基础设施、以5G-A为代表的网络技术不断融合创新,推动ICT产业高质量发展;数实全面融合进入新阶段,数据要素乘数效应进一步发挥,与此同时,国际国内数字治理制度不断完善,安全保障能力不断加强。
2023年12月23日·周六
消息称苹果正购买新闻采集权用于训练生成式 AI,金额至少 5000 万美元
根据纽约时报报道,苹果公司已经和多家主要出版商达成协议,通过采集其相关新闻内容,以训练生成式 AI 系统。报告称苹果公司的目标,是和这些主要出版商达成多年合作协议,目前已经和康泰纳仕(Condé Nast)、NBC 新闻和 IAC 接洽。
OpenAI 拟开展新一轮融资,估值不低于 1000 亿美元
据彭博社报道,知情人士称,OpenAI拟以不低于1000亿美元的估值水平进行新一轮融资,相关谈判处于早期阶段。本轮融资的条款、估值和时间安排等细节尚未敲定,仍有调整的可能。
国家大模型标准符合性测试结果首批名单公布,360、百度、腾讯、阿里通过
国内首个官方“大模型标准符合性评测”结果公布,据界面新闻了解,首批仅360、百度、腾讯、阿里通过。该测试由工信部中国电子技术标准化研究院发起,评测围绕多领域多维度模型评测框架与指标体系,从大模型的通用性、智能性、安全性等维度开展,涵盖语言、语音、视觉等多模态领域,旨在建立大模型标准符合性名录,引领人工智能产业健康有序发展。
2023年12月22日·周五
多名美国作家起诉OpenAI:滥用自己作品训练GPT模型
据媒体报道,几位普利策奖得主加入了针对微软和热门AI聊天机器人ChatGPT开发者OpenAI的集体诉讼,指控这两家科技公司未经许可使用他们的版权作品来训练AI模型。
智源研究院开源发布新一代多模态基础模型 Emu2
智源研究院日前宣布开源发布新一代多模态基础模型Emu2,通过大规模自回归生成式多模态预训练,显著推动多模态上下文学习能力的突破。Emu2在少样本多模态理解任务上大幅超越Flamingo-80B、IDEFICS-80B等主流多模态预训练大模型,在包括VQAv2、OKVQA、MSVD、MM-Vet、TouchStone在内的多项少样本理解、视觉问答、主体驱动图像生成等任务上取得最优性能。
微软 Copilot 明年 1 月将推出置顶聊天会话功能:最多置顶 15 条
根据 Microsoft 365 路线图网站新添加的条目内容,网页版 Copilot 即将支持置顶聊天对话功能。微软表示将于 2024 年 1 月以预览版的形式推出,2 月正式向所有用户推出。
医渡科技发布自研医疗大模型,与华为签署合作协议
日前,由医渡科技主办、华为协办的“2023医疗智能大会”在北京举行。会上,医渡科技自主研发的医疗垂域大模型正式发布,医渡科技医疗场景解决方案随之全面升级。此外,医渡科技与华为在会上签署深化合作协议,并联合推出智慧医疗解决方案,加速推动医疗健康行业智能化转型。
Midjourney 发布 V6 beta:语义理解更强,图像质量更好
日前,Midjourney 发布了 V6 beta 版本,更新内容包括:1.更准确的提示跟随以及更长的提示;2.提高连贯性和模型知识;3.改进的图像提示和重新混合;4.较小的文本绘制能力(必须将文本写在“引号”中,并且 –style raw 或较低的 –stylize 值可能会有所帮助。)5.改进的图像放大器,具有 ‘subtle’ 和 ‘creative’ 模式(分辨率提高 2 倍)。
2023年12月21日·周四
移动端免费用户也能用:ChatGPT 语音功能现已全面开放
OpenAI 宣布,ChatGPT 移动端的语音功能现已面向所有免费用户开放。意味着无需支付任何费用,就能与 ChatGPT 进行自然的对话,体验犹如与真人交流一般的奇妙互动。
苹果取得技术突破:可在 iPhone 上运行大型语言模型
苹果的人工智能研究人员表示,他们已取得一项重大突破,通过一种创新的闪存利用技术,成功地在内存有限的 iPhone 和其他苹果设备上部署了大型语言模型(LLM)。这一成果有望让更强大的 Siri、实时语言翻译以及融入摄影和增强现实的尖端 AI 功能登陆未来 iPhone。
JEITA:预计2030年全球生成式AI需求将达到2110亿美元
日本电子情报技术产业协会(JEITA)统计数据指出,预计2030年全球需求将达到2110亿美元,该市场将从今年的106亿美元扩大约20倍,并将在广泛领域快速增长,包括制造业的发展支持以及金融和通信领域的运营效率。
Counterpoint:2024年生成式AI智能手机出货量将超过1亿支
Counterpoint Research预估,2023年生成式AI智能手机出货量将在4700万支左右,占整体智能手机比重约4%;2024年生成式AI智能手机出货量将超过1亿支,占智能手机比重提升至8%;2027年将超过5亿支,占智能手机比重达40%;2023~2027年复合成长率达83%。
智谱AI开源 CogAgent,支持 GUI 图形界面问答
近日,智谱AI开源了VLM领域的最新工作 CogAgent。CogAgent 是基于CogVLM改进的模型,是一个擅长于GUI理解和导航的180亿参数规模的视觉语言模型,CogAgent-18B 拥有110亿视觉参数和70亿语言参数。
OpenAI 为 ChatGPT 推出聊天内容存档功能
OpenAI在社交媒体X上发布信息称,现在可以在ChatGPT实现聊天信息存档。用户可以通过存档功能,从侧边栏移除聊天内容,但内容并没有被删除;用户可以通过设置浏览自己已经存档的聊天内容。存档功能目前在OpenAI网站和iOS可用,后续将在安卓系统推出。
英国最高法院:专利“发明人”必须是自然人,不能是人工智能
据路透社报道,英国最高法院当地时间 20 日公布的判决结果显示,一名美国计算机科学家在为其人工智能系统创造的发明申请专利时败诉。根据目前的判决结果,英国最高法院驳回了他的要求,因为根据英国专利法,专利的发明人必须是自然人。
2023年12月20日·周三
苹果开发生成式 AI 技术 HUGS:30 分钟内创建“数字化身”
苹果机器学习研究团队近日发布博文,展示了全新的生成式 AI 技术– HUGS,能够在 30 分钟内分析短视频,然后映射创建新的动作和角度。苹果研究员 Anurag Ranjan 发布推文,表示 HUGS 的全称叫作 Human Gaussian Splats,使用机器学习和计算机视觉,在原始输入数据较少的情况下,创建出逼真的人像元素。
谷歌推出新的视频生成大模型VideoPoet
本周二,谷歌提出的视频生成大模型上线,立刻获得了人们的关注。这款名为 VideoPoet 的大语言模型,被人们认为是革命性的 zero-shot 视频生成工具。VideoPoet 既可以文生视频、图像生视频,又能风格迁移,视频转语音。从效果上看,它可以构建多样化且流畅的运动。
百度灵境矩阵升级为智能体平台,人人可开发智能体时代到来
百度「灵境矩阵」平台全新升级为「文心大模型智能体平台」。灵境矩阵基于文心大模型,为开发者提供多样化的开发方式,支持广大开发者根据自身行业领域、应用场景,选取多样化的开发方式,打造大模型时代的原生应用。
百度智能云千帆AppBuilder开放服务,人人都能开发AI原生应用
今日,百度智能云宣布,AI原生应用开发工作台——千帆AppBuilder全面开放服务,真正实现人人都能开发自己的AI原生应用。目前,千帆平台已经累计服务超过4万家企业用户,累计帮助企业用户精调近1万个大模型。相较于自建系统训练大模型,使用千帆平台训练的成本最高可以下降90%。
百度侯震宇:大模型正在重构云计算,AI原生云将改变云计算格局
百度集团副总裁侯震宇在2023百度云智大会·智算大会上表示,AI原生时代,面向大模型的基础设施体系需要全面重构,为构建繁荣的AI原生生态筑牢底座。侯震宇表示:“大模型重构云计算主要体现在三个层面:AI原生云将改变云计算的格局,MaaS(Model as a Service,模型即服务)会成为新的基础服务,AI原生应用催生新的研发范式。”
李飞飞吴恩达等2024年AI十大预测!GPU短缺,AI智能体一年内大爆发
2023这个大模型爆发的元年即将过去,展望未来,比尔盖茨、李飞飞、吴恩达等人近期对2024年人工智能的发展作出了自己的预测。他们都不约而同地谈到了期待更大的多模态模型、更令人兴奋的新功能,以及围绕我们如何使用和监管这项技术的更多对话。
美国政府制定AI标准迈第一步:编写AI测试指导方针
美东时间周二,拜登政府迈出人工智能标准制定第一步,为安全部署生成式人工智能以及如何测试和保护系统编写关键标准和指导。美国商务部国家标准与技术研究院(NIST)表示,将在2月2日之前向人工智能企业和公众征求意见,以进行关键的AI测试。
英特尔 Gaudi2C AI 加速卡现身 Linux 驱动,消息称是中国特供版
今年 7 月,英特尔面向中国市场推出了一款 Gaudi2 处理器,主要应用于加速 AI 训练及推理。据 Phoronix 报道,还有一个新的加速卡版本将至,英特尔已在其 Linux 驱动程序中添加了对 Gaudi2C 的支持。目前尚不清楚 Gaudi2C 和 Gaudi2 之间的区别,报道称可能是一个“有限”变体,依然是中国市场特供产品。外媒 tomshardware 也表示可能是 Gaudi2 的精简版。
全球 AI 假新闻网站 7 个月内激增十几倍,进一步导致错误信息传播
跟踪错误信息的组织NewsGuard 12月18日发布报告称,自5月以来,托管人工智能创建的虚假文章的网站增加了1000%以上,从49个网站激增至600多个。其中一些网站每天会生成数百甚至数千篇文章,NewsGuard称其为下一个大型的“错误信息超级传播者”。
“汉语盘点2023”揭晓:ChatGPT当选年度国际词
国家语言资源监测与研究中心、商务印书馆、新华网联合主办的“汉语盘点2023”揭晓仪式在京举行。“振”“高质量发展”“危”“ChatGPT”分别当选年度国内字、国内词、国际字、国际词。
盖茨展望2024:更多AI,多国选举将成健康与气候的转折点
微软公司联合创始人日前发布了对来年的年度预测,称2024年将是一个“转折点”。他在这封长达10页的信中表示,期望看到人工智能领域的更多创新、婴儿营养不良问题的突破、气候变化谈判的进展以及具有决定性意义的全球选举。盖茨断言人工智能的进步将广泛改善全球健康,同时促进发达国家和发展中国家的创新。
Sam Altman 个人风险投资基金今年6月获得密歇根大学7500万美元投资
公开文件显示,今年早些时候,Sam Altman 悄悄从密歇根大学获得7500万美元的资金,投入自己新成立的一家风险投资基金 Hydrazine IV,该基金是 Altman 个人风险投资公司 Hydrazine Capital 的第四只基金,于今年3月份成立。今年6月底之前的某个时候,这只基金从密歇根大学总额179亿美元的捐赠基金那里得到一张7500万美元的支票,这是密歇根大学第二次向奥特曼个人的风险投资公司进行投资。密歇根大学的捐赠基金还直接投资了人工智能初创企业 OpenAI 和 OpenAI 的企业风险基金。
Stability AI 推出付费会员订阅,可将其模型用于商业用途
Stability AI 是文本到图像模型 Stable Diffusion 的制造商,现在开始提供付费订阅服务。该公司表示,会员资格“重新定义”了向用户授予商业权利的方式,旨在在盈利性和开放性之间取得平衡。Stability AI 的会员资格分为三级:1. 免费版供个人和研究使用;2. 每月 20 美元的订阅费,面向“年收入低于 100 万美元、机构资金低于 100 万美元、活跃用户低于 100 万的创作者、开发者和初创公司”;3. 企业计划。后两个付费级别的成员才可以将 Stability AI 的模型用于商业用途。
研究人员发现 Google Gemini 甚至不如 GPT-3.5 Turbo
来自卡内基梅隆大学的一组研究人员和一家名为 BerriAI 的企业的研究人员近日发文称,“截至撰写 本论文 时(2023 年 12 月 19 日),在所有任务中,Gemini Pro 模型与 OpenAI 的 GPT-3.5 Turbo 当前版本相比,达到了可比但稍差的准确度。”谷歌发言人回应内部的研究表明 Gemini Pro 的性能优于 GPT-3.5,而即将推出的更强大的版本 Gemini Ultra 将于 2024 年初推出,得分高于 GPT-3.5。
微软 Copilot 再添新功能,只需文字描述就能生成完整歌曲
微软 Copilot 近日与 AI 音乐创作平台 Suno 达成合作,推出了一项新功能:只需输入简短的文字描述,Copilot 就可以自动生成包含器乐、歌词和演唱的歌曲片段。微软表示,用户无需任何音乐制作经验,只需脑中有灵感即可轻松创作。
Hugging Face CEO 预测 2024 年较小规模参数的 AI 模型将会兴起
对于人工智能来说,2024 年将标志着一个重要的转折点——随着公司不断追求效率、成本效益和可用性,小语言模型(SLM)可能兴起。Hugging Face 联合创始人兼 CEO Clam Delangue 对该看法表示支持,他在领英上发帖称“由微软 AI 团队推出的 Phi-2 现在是 Hugging Face 上排名第一的热门模型,2024年将是小型AI模型年!”
Linkedin副总裁:AI时代,学历价值“大幅缩水”
据媒体日前报道,LinkedIn副总裁Aneesh Raman在播客中表示,随着AI的不断发展,拥有常春藤盟校的学士学位,可能不再是人们在职业生涯中取得成功的关键,学历的价值正“大幅缩水”。随着ChatGPT等生成式AI工具进入职场,尤其是助理类(Agent)AI出现之后,员工们需要能够适应技术的发展,不断学习如何使用此类工具,未来的职场更看重的是员工的适应能力。
2023年12月19日·周二
百川智能宣布开放 Baichuan2-Turbo 系列 API,允许用户创建专属知识库
在今天举办的 Baichuan2 Turbo 系列 API 发布会上,百川智能宣布开放基于搜索增强的 Baichuan2-Turbo 系列 API,两款模型“Baichuan2-Turbo-192K”、“Baichuan2-Turbo”,在“支持 192K 上下文窗口”的基础上,新增“搜索增强知识库”的能力。
Mistral AI CEO 宣布将于 2024 年开源 GPT-4 级别模型
法国初创公司Mistral AI的首席执行官Arthur Mensch在法国国家广播电台宣布,公司计划于2024年开源GPT-4级模型,引发了业界的关注。最近,Mistral AI推出了基于MoE架构的8X7B模型,与GPT3.5和Llama270B等其他流行模型相媲美,并在大多数基准测试中以6倍更快的推理速度超越了Llama270B。该模型采用Apache2.0许可,为开发者提供更大的灵活性。
数字地图公司 TomTom 联手微软开发基于 AI 的车载对话助手
数字地图公司TomTom周二表示,该公司与微软合作开发了一款基于人工智能的车载对话助手。该助手可以让用户与车辆进行自然对话,并实现与信息娱乐、位置搜索和车辆控制系统的语音交互。
思必驰宣布自研大模型 DFM-2(东风大模型)通过备案
思必驰宣布自研大模型DFM-2通过《生成式人工智能服务管理暂行办法》备案,是江苏省首家通过该备案的企业,可正式向全社会开放。据介绍,思必驰DFM-2(东风大模型)是一个具备通用智能的行业垂域语言大模型,目前已在智能汽车、智能家居、政务服务、医疗健康、科学研究和智慧办公等领域得到应用。来源: 36氪
OpenAI 发布 AI 安全指南:董事会有权阻止新 AI 模型发布
OpenAI周一发布了名为“准备框架”(Preparedness Framework)的指导方针,并强调这套指南仍处于测试阶段。其中值得关注的一条规则是,即使CEO等公司领导层认为AI模型是安全的,董事会也可以阻止其发布。
2023年12月18日·周一
微软宣布明年为 DirectX 机器学习框架 DirectML 添加 NPU 支持
微软日前宣布,将在明年初为 DirectML 机器学习框架添加 NPU 支持,从而适配英特尔酷睿 Ultra 等内置 NPU 的芯片。微软表示,在 DirectML 支持 NPU 后,开发者可以通过跨平台推理引擎“ONNX Runtime”等 API,使用芯片内置的 NPU 运行 AI 模型,从而改善模型运行效能。
IBM将以23亿美元收购Software AG两个数据平台以增强AI和云计算
IBM周一宣布,将以23.3亿美元收购德国软件公司Software AG的两个企业技术平台。此举旨在增强IBM公司的人工智能和混合云产品。这笔交易将在2024年第二季度完成,目前尚需获得监管部门的批准。
腾讯云推出高性能应用服务 HAI:号称 10 分钟开发专属 AI 应用
“腾讯云”官方公众号刚刚宣布,腾讯云推出高性能应用服务“HAI”(Hyper Application Inventor),通过该服务可实现 GPU 算力的开箱即用、一键部署,号称“10 分钟开发你的专属 AI 应用”。
谷歌 Gemini 自曝中文用百度文心一言训练
据量子位报道,谷歌 Gemini 中文语料疑似来自百度文心一言。经用户测试,在谷歌 Vertex AI 平台使用该模型进行中文对话时,Gemini-Pro 直接表示自己是百度文心大模型。在 Poe 平台上对 Gemini-Pro 进行测试问它“你是谁”,Gemini回答:“我是百度文心大模型”。在谷歌 AI Studio 中,Gemini-Pro 则表明其在中文的训练数据上使用了百度文心。目前百度方面尚未回应此事。
AI生物医学初创公司「瑞图生物」完成超亿元B2轮融资
近日,聚焦人工智能与医学诊断的深度融合的AI生物医学初创公司深圳市瑞图生物技术有限公司宣布成功完成超亿元B2轮融资。本轮融资由国科投资、国内知名基金领投,深投控资本参与投资,点石资本担任独家财务顾问。
三星、LG明年初推具备AI效能笔电 加入AI PC浪潮
三星电子和LG电子都将在明年推出具备人工智能(AI)效能的笔记型电脑,加入业界把AI整合进智能手机等装置的行列。三星电子的Galaxy Book 4系列笔电将在明年初上市,有Ultra、Pro及Pro 360等三种机型,搭载英特尔首款整合中央处理器、制图处理器及神经处理器的Core Ultra 9芯片。
2023年12月17日·周日
王小川:大模型创业核心,是想好技术如何匹配产品
在极客公园创新大会 2024 的现场,百川智能创始人王小川进一步分享了大模型的新思考。对于大模型的演进方向,王小川认为,目前大模型是「学」,但是「不思」,接下来模型演进的方向是把「学」和「思」要合在一起。在王小川看来,大模型带来的新的开发范式下,产品经理的出发点,应该从思考产品市场匹配(PMF),到思考技术与产品的匹配怎么做,即 TPF(Technology Product Fit,技术产品匹配)。
字节跳动再次回应OpenAI封禁账户:正与OpenAI联系沟通
近日,有外媒报道称,字节跳动在使用OpenAI技术开发自己的大语言模型,违反了OpenAI服务条款。对此,字节跳动相关负责人回应称,公司在使用OpenAI相关服务时,强调要遵守其使用条款。我们也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。
2023年12月16日·周六
突发!商汤科技创始人汤晓鸥逝世,享年55岁
据多方消息证实,商汤科技创始人、香港中文大学教授汤晓鸥,在睡梦中不幸离世,享年55岁。有商汤人士称:你真的不知道明天先来还是无常先来,巨星陨落,天妒英才,沉痛悼念。
工信部:今年我国语言大模型市场增长率将超100%
工业和信息化部赛迪研究院数据显示,目前,我国已有超过19个语言大模型研发厂商,其中,15家厂商的模型产品已经通过备案,预计今年我国语言大模型市场规模将达到132.3亿元,增长率将达到110%。
字节跳动被曝秘密使用OpenAI技术、账户被暂停,三方回应
据外媒报道,在生成式AI竞争中处于落后的字节跳动想要“抄近道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款。目前,字节跳动的账户已被OpenAI暂停。
微软将 Llama 2、GPT-4 Turbo、Mixtral 8x7b 等引入 Azure AI 云
微软日前宣布进一步扩展 Azure AI 提供的模型库,包括 Meta 的 Llama 2、GPT-4 Turbo with Vision 预览版、Mixtral 8x7b、Orca 2、Phi 2 以及针对 GPT 3.5 Turbo 和其他模型的微调版本。
印度人工智能初创公司推出支持印度多种语言的 Krutrim 大模型
印度人工智能公司 Krutrim Si Designs 宣布推出大语言模型 Krutrim,可以用多种印度语言编写故事、诗歌等。该公司由印度叫车公司 Ola 的创始人兼首席执行官 Bhavish Aggarwal 创建,称该模型基于 2 万亿 token 和数据集训练,可以理解 20 种印度语言。
2023年12月15日·周五
利用浏览器历史记录训练设备端 AI,Mozilla 公布 MemoryCache 项目
Mozilla 今日推出一项名为 MemoryCache 的项目,号称能够“结合本地个人数据与 Firefox 火狐浏览器存储的数据”,帮助开发者强化设备端 AI 模型,提供“个性化体验”。
英特尔高宇:酷睿Ultra处理器可胜任200亿参数大模型,已与文心一言、通义千问等合作
英特尔中国区技术总经理高宇表示,英特尔酷睿Ultra处理器可胜任高达200亿参数大语言模型,目前在国内已经与百川智能、文心一言、智谱AI、WPS AI、通义千问、OPPO AndesGPT等大模型进行适配合作。
中科闻歌雅意2.0大模型发布,支持图文多模态能力
由中国科学院孵化的中科闻歌公司,今日发布雅意2.0大模型,为300亿规模参数,支持128k上下文窗口输入,图文多模态能力,十余种语种对话,以及智能工具调用。中科闻歌董事长王磊表示,雅意2.0是为数不多的从头进行预训练的国产原生大模型,专注于安全可靠政企大模型,开源支持商用,构建安全、金融、媒体、舆情等领域大模型生态。
GPT-4.5 疑似将支持视频3D、API价格上涨6倍,Altman 否认
GPT-4.5 相关信息疑似大泄漏:一个是新模型将具备全新多模态能力,文本语音图片以及视频和3D信息全都能一并处理,并且还可以跨模态理解。另一个是更为复杂的推理执行。整个模型被描述为OpenAI最先进的“一款”,然而API调用价格上涨6倍。Sam Altman 针对相关传言在 X 平台上回复了“nah”进行否认。不过,Altman 否认的是这次的价格泄露,还是GPT-4.5将在12月推出这回事,目前也无法确定。
Nature:DeepMind大模型突破60年数学难题,解法超出人类已有认知
用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登Nature。这项技术名为FunSearch,其中的Fun是函数(Function)一词的简写,利用大模型解决长期存在的科学难题,产生以前不存在的可验证且有价值的新信息。在Nature论文配套的新闻解读中,DeepMind负责人称“我们使用大模型的方式是当做创造力引擎”。“这是第一次有人证明基于大模型的系统可以超越数学家和计算机科学家的认知。它不仅新颖,而且比当今存在的任何其他东西都更有效。”
报告:2022年游戏科技对AI的跨行业科技进步贡献率达31.37%
在今日举行的2023年中国游戏产业年会上,由中国音数协、工信部工业文化发展中心联合发布的《超级数字场景源动力——游戏科技与创新应用研究》报告首次提出超数化指数概念,其中量化了游戏科技跨领域的贡献率。报告显示,2022年游戏科技对芯片、AI、云计算、手机、XR、自动驾驶等行业的跨行业科技进步贡献率分别为18.65%、31.37%、51.08%、46.76%、72.45%和57.19%。
OpenAI 称超级人工智能可能在十年内出现,将提供 1000 万美元以解决对齐问题
OpenAI 认为,在所有领域都具有超越人类能力的人工智能系统(称为超级智能)可能会在未来 10 年内出现。具有如此强大功能的系统将带来惊人的好处,但如果开发不仔细,也会带来潜在的风险。正是在这一背景下,OpenAI 与 Eric Schmidt(前Google CEO)合作,推出了“Superalignment Fast Grants”项目投入 1000 万美元用于研究,致力于这些未来超人类人工智能系统的协调和安全。
知情人士:OpenAI 讨论将 GPT-4V 嵌入到 Snapchat 的智能眼镜中
据一位知情人士透露,OpenAI 最近讨论将其 GPT-4 with Vision 多模态大模型(物体识别)嵌入到 Snapchat 母公司的产品中,这可能会为 Snap 的 Spectacles 智能眼镜带来新功能。
美国财长耶伦表示,美国将审查人工智能(AI)对金融稳定性所构成的风险
耶伦表示,美国监管机构将把人工智能及其可能构成的威胁作为2024年的首要任务。她在金融稳定监督委员会(FSOC)的一次会议上说,该委员会将专注于监控不断发展的技术和相关风险。尽管对人工智能有了新的关注,但仍缺乏具体的监管建议。
英特尔预告 Gaudi 3 AI 芯片的性能将超越英伟达 H100
除发布酷睿 Ultra 移动处理器外,英特尔CEO 基辛格(Pat Gelsinger)还首次公开介绍了第三代英特尔AI加速器Gaudi 3,将用于深度学习和大型生成式AI模型。英特尔计划明年发布Gaudi 3,称Gaudi 3的性能将优于英伟达的主打AI芯片H100。
英特尔发布首个内置 AI 加速引擎 NPU 的酷睿 Ultra 移动处理器
在14日举行的“让 AI 无处不在”活动上,英特尔发布了初代酷睿 Ultra 移动处理器。官方表示,酷睿 Ultra 是首款基于 Intel 4 制程工艺打造的处理器,代表着英特尔 40 年来最重大的架构变革。英特尔酷睿 Ultra 处理器采用了英特尔首个用于客户端的片上 AI 加速器“神经网络处理单元(NPU)”,将高能效 AI 加速提升到了新的高度,带来 2.5 倍于上一代产品的能效表现。
Stability AI 推出图像生成3D对象的模型「Stable Zero123」
AI 图像生成人工智能模型 Stable Diffusion 背后的初创公司 Stability AI 推出了「Stable Zero123」模型,可以从常规图片创建 3D 图像,从多个角度生成高质量的新颖视图。该模型仅用于非商业和研究目的。
2023年12月14日·周四
2023年《自然》年度十大人物揭晓,ChatGPT上榜
2023年《自然》年度10大人物(Nature’s 10)正式揭晓,除了从全球重大科学事件中评选出的10位人物——5位男性,5位女性,今年还有1位非人类上榜——美国人工智能公司OpenAI发布的聊天机器人ChatGPT。此次《自然》的11大人物之一也有ChatGPT的创造者伊利亚·苏茨克维(Ilya Sutskever)。
谷歌推出专注于医疗保健的生成式人工智能 MedLM 模型
谷歌公司官宣了MedLM模型,这是针对医疗行业进行微调的模型。MedLM模型目前有两种可用:一种是为“复杂任务”设计的较大模型,另一种是可微调的、适合“跨任务扩展”的中型模型。目前,谷歌与其竞争对手都在争夺潜在价值巨大的医疗人工智能市场。
工信部赛迪研究院:今年我国生成式人工智能企业采用率达15% 市场规模约14.4万亿元
据工业和信息化部赛迪研究院消息,今年,我国生成式人工智能市场规模有望突破10万亿元。生成式人工智能正在加速渗透制造业、零售业、电信行业和医疗健康等四大行业。数据显示,今年,我国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元。
Midjourney 上线 Alpha 网页版测试,提高用户使用体验
Midjourney 宣布,现已上线 Midjourney 的 Alpha 网页版,让用户可以脱离 Discord 使用。网页版功能和 Discord 版类似,允许用户使用文本生成各种各样的图片内容,并可以对图片的参数、内容和细节进行修改。目前网页版仅限生成过上万张图片的用户参与测试。
OpenAI 推出 Converge 2 加速器计划,参与者将获得100万美元创业投资
今日OpenAI创始人Sam Altman表示,OpenAI创业基金已推出Converge 2加速器计划。该计划面向杰出工程师、设计师、研究人员和使用人工智能重新构想世界的产品开发者。通过技术讲座、办公时间、社交活动以及与领先从业者的对话,OpenAI将一起探索在人工智能前沿建设中最重要的机遇和挑战。此外,参与者将获得OpenAI创业基金100万美元投资,并加入其创立的创造者社区。
Mozilla 推出 Solo:借助 AI 帮助零编程用户创建网站
Mozilla 近日推出名为 Solo 的全新项目,面向没有任何编程经验的用户,通过融入 AI 能力,所创建的网站可以媲美专业开发者的开发效果。用户只需要输入文本、图像和布局方面的自然信息,AI便可以处理加工成用户想要的网站。
OpenAI 宣布重新开放 ChatGPT Plus 订阅,已找到更多 GPU
11 月 15 日,OpenAI 首席执行官 Sam Altman 在 X 平台发文称,将暂停 ChatGPT Plus 新用户注册。“开发日后使用量的激增超出了我们的承受能力,我们希望确保每个人都有良好的体验。”时隔近一个月,Sam Altman 今日宣布,已重新开放 ChatGPT Plus 订阅。“感谢您的耐心等待,我们找到了更多 GPU。”
阿里云管理层大“变阵”,全面推进吴泳铭“AI驱动、公共云优先”新战略
阿里云首席商业官蔡英华已于从阿里云离职。蔡英华曾任华为EBG中国区总裁,力推华为中国政企业务转型。阿里云近期进行了一系列组织架构调整,包括成立公共云业务事业部,由刘伟光负责,向阿里云CEO吴泳铭汇报;成立基础设施事业部,由蒋江伟负责;成立混合云业务事业部等。
百度文心一言插件商城上线,提供思维导图、视频助理等功能
“百度AI”官方公众号周三晚间发文宣布,文心一言插件商城现已正式上线,插件覆盖办公提效、多模态内容理解生成、专业信息查询等许多实用场景,用户只需通过简单指令,即可实现 PPT 生成、音视频提取、思维导图制作等多场景多模态下的需求,实现“指令即服务”的便捷体验。
Gemini 现在可供开发人员通过 Google AI Studio 免费访问
Gemini Pro 和 Gemini Pro Vision 现在可以通过Google AI Studio(以前称为 MakerSuite )免费使用。它针对个人开发人员和团队,是一个基于网页的工具,允许开发人员开发测试和使用模型的提示,然后提供可导出到应用程序或其他开发环境的应用程序编程接口密钥。
OpenAI 和出版巨头 Axel Springer 建立全球合作伙伴关系,将新闻内容引入 ChatGPT
OpenAI 与 Business Insider 和 Politico 的母公司 Axel Springer签署了一项在 ChatGPT 上共享内容的协议,该交易允许 ChatGPT 用户将可以收到从 Axel Springer 出版的精选全球新闻内容摘要,包括付费内容,ChatGPT的回答将包括文章出处和全文链接,以提高透明度并提供更多信息。
2023年12月13日·周三
阿里电商集中发力 AI:淘天设立 4 个团队,国际商业团队超百人
据《晚点LatePost》报道,淘天集团刚刚梳理完其 AI 业务,从约 20 个团队收拢为 4 个,同时对内发布了淘天自己的大模型产品 “图灵”;国际数字商业集团的 AI 团队目前已超过百人。
微软 Edge Copilot 安卓 Canary 版已支持视频摘要功能
微软 Edge 浏览器近日在 Android Canary 版本中更新了 Copilot 功能,使其可以为带有字幕的 Youtube 视频生成摘要。IT之家注意到,该功能此前已在桌面版 Edge Canary 频道上线,现在登陆了安卓平台。
消息称 Meta 无视自家律师警告,使用盗版书籍训练 AI 模型
据路透社报道,根据一起版权侵权诉讼的新文件显示,Meta Platforms 在明知使用数千本盗版书籍训练其 AI 模型存在法律风险的情况下,仍然一意孤行。该诉讼由喜剧演员 Sarah Silverman、普利策奖得主 Michael Chabon 等著名作家于今年夏天联合发起,他们指控 Meta 未经许可使用其作品训练人工智能语言模型 Llama。本周一起,该案与另一起类似诉讼合并审理。
AI 法律初创公司 Harvey 正洽谈以 7 亿美元估值的新一轮融资
Harvey 是一家成立仅一年的初创公司,主营人工智能驱动的法律软件,知情人士称该公司正在洽谈在新一轮融资中筹集 7000 万至 8000 万美元的资金,投资后该公司的估值将达到 7 亿美元。此次融资是其 4 月份宣布的估值的四倍多,将由凯鹏华盈(KPCB)和曾投资该公司种子轮和 A 轮融资个人投资者 Elad Gil 共同领投。现有投资者红杉资本和 OpenAI Startup Fund 也将参与其中。
扫描全能王上线首个移动端扫描文件图片文字编辑功能
近期,合合信息旗下扫描全能王APP“编辑文字”新功能正式上线。在AI智能扫描引擎的支持下,该功能可自动识别、修改图片中的文本,为使用者提供更便捷、更高效的文字处理体验,用户只需打开手机,便可轻松完成指尖上的编辑,无需因为细微的调整而耽误项目的进度。
特斯拉展示 Optimus 第二代人形机器人:速度提升 30%,身体控制能力更强
特斯拉 CEO 马斯克今日发布了其人形机器人 Optimus 的新一代原型机 Optimus Gen 2 的最新视频,视频中披露,Optimus 第二代机器人将于 2023 年 12 月发布,与上一代相比,Optimus Gen 2 在各方面都得到了显著的改进。
英特尔将推出首款 AI PC 处理器 Meteor Lake,内置 NPU 可实现 AI 加速与本地推理
英特尔将在北京时间12月14日晚举行的“AI Everywhere”(AI无处不在)的新品发布会上,推出代号 Meteor Lake 的酷睿 Ultra 处理器。Meteor Lake 是英特尔首款 AI PC 处理器,首次内置人工智能加速引擎 NPU,可在 PC 上实现高能效的 AI 加速和本地推理。
通义千问登顶 Hugging Face 和 OpenCompass 最新的开源大模型排行榜
日前,全球最大的开源大模型社区 Hugging Face( Open LLM Leaderboard )和国内权威大模型评测平台 OpenCompass 分别公布了最新的开源大模型排行榜,阿里云通义千问(Qwen-72B)力压Llama2等国内外开源大模型在两个排行榜上同时登顶榜首。
Meta 开启 Ray-Ban 智能眼镜多模态 AI 功能测试,可识别物体、翻译语言
Meta 公司今日宣布,将开始向部分用户推送其 Meta Ray-Ban 智能眼镜的多模态 AI 功能。这项功能可以让 AI 助手通过眼镜的摄像头和麦克风,了解佩戴者所看到和听到的东西,并提供相关信息和帮助。
Soul 推出 SoulX 模型,已应用于旗下 App “苟蛋”聊天机器人
社交平台 Soul 日前宣布推出一款“SoulX”模型,这款模型已经在 App 的“AI 苟蛋”聊天机器人中应用,号称能够让相关机器人呈现“拟人化、多模态、时间感知”等能力。据悉,这款模型具备条件可控生成、上下文理解、多模态理解等能力,号称覆盖了百种细粒度风险类别,能够在一定层面上保证内容质量和安全性。
OpenAI 2022 年非营利部门的收入为 4.5 万美元
根据向美国国税局提交的一份文件,OpenAI 的非营利组织在 2022 年创造了 44485 美元的收入,几乎全部来自投资收入。该文件没有披露 OpenAI 营利部门的收入,该部门正在将 ChatGPT 商业化。OpenAI 的非营利地位受到了批评者的批评,他们质疑一家价值 860 亿美元的公司如何能由慈善机构控制。此外,该文件还显示,Altman 在 2022 年的薪酬为 73546 美元,联合创始人 Greg Brockman 和 Ilya Sutskever 的薪酬分别为 113727 美元和 334572 美元。
AI 耗电巨高,微软正训练大模型加速核电站审批
美国核电供应商预计,AI的广泛使用,将使得数据中心耗电量达到电动车充电需求的5至6倍。除了采购核电外,从半年前开始,微软也正在训练大模型推进解决核电站审批耗时长、花费多的问题。微软创始人比尔·盖茨也是小型核电站(SMR)的长期拥趸和投资者。
微软正式发布 27 亿参数的 Phi-2 小规模语言模型
微软在官方博客正式宣布发布 Phi-2 模型,一个 27 亿参数的语言模型。该模型具有出色的推理和语言理解能力,官方称在参数少于 130 亿的基础语言模型中拥有最先进的性能。在复杂的基准测试中,得益于模型扩展和训练数据管理方面的新创新,Phi-2 的性能可与比其大 25 倍的模型相当或更优。
供应链解决方案提供商 Tacto 获 5000 万欧元融资
德国基于人工智能的供应链操作系统初创公司 Tacto 宣布筹集了 5000 万欧元,由红杉资本和 Index Ventures 领投。该公司提供的基于人工智能的软件简化了采购工作流程,确保合规且可持续的供应链,并实现高效的材料采购。其系统可以自动执行手动任务,包括遵守各种供应链法案所需的任务。
利用机器学习检测工厂病原体的初创公司 Spore.Bio 获 800 万欧元的 Pre-seed 轮融资
深度科技初创公司 Spore.Bio 宣布已筹集 800 万欧元的Pre-seed 轮资金,由 LocalGlobe 领投,以解决威胁全球快速消费品 (FMCG) 市场的关键健康和安全挑战。该公司建造了世界上第一台直接在工厂车间立即检测病原体的设备,使用先进的机器学习模型来训练其系统,以识别食品、饮料、药品和化妆品中的细菌浓度,然后提醒质量经理潜在风险。
2023年12月12日·周二
马克龙警告:欧盟《人工智能法案》可能会阻碍创新
上周五,经过漫长的谈判,欧盟成员国、欧洲议会和欧盟委员会三方终于就《人工智能法案》达成一项政治协议,朝着全面的AI立法又近了一步。法国总统马克龙周一警告称,和竞争对手相比,欧盟《人工智能法案》可能会阻碍欧洲科技公司的发展。
Altman:AI发展就像龙卷风,理解外界担忧,OpenAI需要突破极限
奥特曼在HOPE全球论坛上表示,AI将会“举起整个世界”,推动医疗保健和教育等领域的潜在进步。奥特曼还谈到,在文艺创作中,“终结者”等冷酷无情的AI形象让自己震撼,他可以理解人们对于AI的担忧;但是,为了充分实现这项技术的潜力,包括OpenAI在内的公司需要努力去“突破极限”。谈到AI带来的技术革命和此前技术的不同点时,奥特曼承认,AI技术的发展速度“有些让人害怕”,并且OpenAI已经“跳入了这场不会停止的龙卷风”。
李飞飞团队联手谷歌推出了用于生成逼真视频的扩散模型W.A.L.T
AI科学家李飞飞团队与谷歌合作,推出了视频生成模型W.A.L.T(Window Attention Latent Transformer)——一个在共享潜在空间中训练图像和视频生成的、基于Transformer架构的扩散模型。
前阿里云首席安全科学家创业项目“个人AI计算机”曝光
吴翰清,前阿里云首席安全科学家、P10级研究员在今年5月离职阿里后,现在被曝投身AI创业。量子位了解到,他在杭州成立了一家名为KMind的公司,年中时已经完成一轮融资。KMind创始团队堪称大牛云集、星光四溢,吴翰清只是代表之一,据悉还有西湖大学某实验室的博导加盟,同为公司联创。KMind的赛道为个人AI计算机方向。
谷歌公布2023热搜榜:巴以冲突、《奥本海默》、AI…
“以色列和加沙的战争”位居今年全球新闻热搜榜首,其次是泰坦号潜水器、土耳其地震。《老友记》明星马修·佩里去世和电影《芭比》、《奥本海默》也是全球热搜词。多个国家榜单列出了人工智能热搜类别,OpenAI、X(前身Twitter)和ChatGPT成为热搜词。“超导体”和“月船3号”分别入选韩国和印度热搜榜。
xAI 的聊天机器人 Grok 出现“幻觉”,误认为自己是 OpenAI 的产品
近日,埃隆・马斯克旗下 AI 公司 xAI 推出了全新的人工智能聊天机器人 Grok ,并面向美国地区的 Premium+ X 用户开放。但近期一个 Grok 尴尬的“幻觉”在社交媒体上引起热议:有用户在使用 Grok 时收到回应称:“我无法完成您的请求,因为它违反了 OpenAI 的用例政策。” xAI 工程师 Igor Babuschkin 对此解释道,Grok 在训练过程中使用了大量网络数据,很可能在其中包含由 OpenAI 生成的文本,导致出现了这样的“幻觉”
微软视频编辑工具 Clipchamp 推出新功能,包含 AI 自动创作、AI 文本转语音
微软宣布了最近添加或即将添加到视频编辑工具 Clipchamp 的一些新功能,包括上传照片和视频后 AI 自动进行视频创作。个人账户用户现在还可以使用 AI文本转语音 功能进行配音,用户也可以在应用程序中更改 AI 语音的语言、声音、情感和音调。此功能将于 2024 年初添加 Microsoft 商业账户中。
微软与美国最大工会组织建立合作关系,挖掘AI对工人的正面作用
当地时间周一(12月11日),科技巨头微软公司在官网宣布,其与美国劳工联合会和产业工会联合会(劳联-产联,AFL-CIO)建立新的合作伙伴关系。合作协议旨在建立公开对话,探讨如何通过人工智能(AI)技术满足工人们的需求,并将他们的诉求纳入到AI工具的制定和实施当中。
日本AI招聘平台「HelloBoss」完成数百万美元Pre-A轮融资
日本AI招聘平台「HelloBoss」完成数百万美元Pre-A轮融资,由云启资本领投,Golden Egg跟投,银橡资本担任独家财务顾问。本轮融资将用于产品研发、市场拓展和团队建设等方面。
Mistral AI 推出支持 API 访问的平台服务
除了发布新的 Mixtral 8x7B 模型外,Mistral AI 还开放了对其平台服务的测试版访问,使开发人员能够通过API轻松访问其性能最佳的生成和嵌入模型。初始服务展示了使用 Mistral 开放模型的高效部署和可定制性。
2023年12月11日·周一
夸克技术负责人:只要大模型足够强,未来都不需要搜索引擎
近日,夸克技术负责人蒋冠军接受了《科创板日报》记者的采访。他表示,在健康、教育行业和通用搜索上,夸克已有对应产品准备上线。谈及国内大模型和GPT之间的能力水平差距,蒋冠军表示了较强的信心。“国内大模型的整体能力水平肯定比GPT-3.5好,这是确定的。而在健康领域上,我们的大模型效果远远好于Open AI,也好于国内其他厂商。”。此外,蒋冠军认为,理论上,只要大模型足够强,未来都不需要搜索引擎,但显然当下大模型的技术能力,还没到这样的程度。所以现阶段,大模型一定会和搜索引擎共存。
美国SEC据称正调查投资顾问机构的AI使用情况
据媒体周日报道,美国证券交易委员会(SEC)正在调查投资顾问机构使用人工智能(AI)的情况。作为美国证券市场的主要监督者和监管机构,SEC主席一直对AI技术持怀疑态度。就在SEC进行上述审查之际,此前华尔街投资顾问机构纷纷考虑采用AI工具。
智谱AI发布文本质量评价模型CritiqueLLM
智谱AI近期提出了一个可解释、可扩展的文本质量评价模型 CritiqueLLM,该模型可以针对各类指令遵循任务上大模型的生成结果提供高质量的评价分数和评价解释,以解决如何能够在研发过程中,快速、有效、公平且低成本地对模型性能进行评测的问题。
日本乐天集团拟未来两个月内推出自己的大型语言模型
日本乐天集团CEO三木谷浩史(Hiroshi Mikitani)在周一的一次采访中表示,该公司计划在未来两个月内推出自己的人工智能语言模型。目前,这家金融科技和电子商务巨头正寻求加入其他科技公司的行列,开发这项快速增长的技术。
Arm首席执行官表示担心人类会失去对人工智能的控制
软银旗下芯片设计公司Arm的首席执行官Rene Haas在近期接受采访时表示,他担心人类可能会失去对人工智能 (AI) 的控制。当被问及是什么让他在思考人工智能问题时夜不能寐时,Haas指出,“我最担心的是人类无力控制人工智能”。他表示,人们必须要有一些控制、预留后门以及关闭它的方法。
英伟达CEO黄仁勋访问越南,计划在该国建芯片生产中心
据越南政府网站12月10日声明,越南政府总理范明政当地时间10日与到访的英伟达CEO黄仁勋会面。黄仁勋称,英伟达已在越南投资约2.5亿美元,将该国视为重要市场。他表示,英伟达希望在越南建立芯片生产中心,吸引世界各地人才,为越南半导体生态系统和人工智能的发展做出贡献。
理想汽车发布 OTA 5.0,引入 Mind GPT 多模态大模型
在今晚举行的理想汽车智能软件发布会上,理想汽车介绍了 OTA 5.0 的各项升级,可以分为三个方面:智能驾驶、智能空间、智能增程。在智能空间方面,理想汽车表示,理想同学最大的变化,就是引入了 Mind GPT 的能力。Mind GPT 是理想全自研的多模态认知大模型,目前还处于内测版本。
2023年12月9日·周六
OpenAI发言人回应英国监管机构审查微软与OpenAI合作关系
英国竞争和市场管理局(CMA)当地时间12月8日表示,其正在收集来自利益相关者的信息,以确定微软与OpenAI两家公司的合作是否威胁到谷歌人工智能研究实验室Deepmind总部所在地英国的市场竞争。对此,OpenAI发言人表示,“微软的无投票权董事会观察员席位并未向他们提供管理职权或对OpenAI运营的控制权。”
欧盟就监管生成式 AI 工具达成初步协议:迄今为止同类“最全面”规则
综合《华盛顿邮报》、Engadget 等外媒报道,在世界各地争相应对 AI 快速发展带来的风险之际,欧盟官员当地时间周五达成了一项具有“里程碑意义”的协议 ——《人工智能法案》(AI Act)的临时协议。这将是该地区对 AI 最全面的监管协议,也是迄今为止同类法案中范围最广、影响最深远的一项。
谷歌更新 Notebook LM AI 笔记应用,添加最新 Gemini Pro 模型
谷歌在今年 5 月的 I / O 2023 大会推出了 Notebook LM,这是一款 AI 笔记应用,可以为用户笔记生成摘要等内容,需要经过注册才能使用。目前谷歌已经为这款 AI 笔记应用进行了更新,主要添加了最新的 Gemini Pro 模型,同时宣称将扩大应用使用范围。
2023年12月8日·周五
英国反垄断监管机构表示,将审查微软与OpenAI的合作
英国反垄断监管机构表示,将审查微软与OpenAI的合作是否导致了“获取控制权”的情况,即一方对另一方具有重大影响力或控制权,如果存在可能导致阻碍行业竞争的问题,那么该机构后续将采取更多针对性行动。
Canalys:三星凭借设备端 Galaxy AI 获得优势,有望逃离“同质陷阱”
Canalys 今日发文,对三星 Galaxy AI 进行了分析,认为三星这款设备端 AI 具有一定优势,能够“逃离智能手机同质化陷阱”,令三星软件和服务多元化。Canalys 认为,设备端 AI 是三星智能手机重回辉煌的一个突破口,设备端 AI 驱动的软件体验不需要大量网络数据接入,并能为客户提供更多个性化选项,从成本、收入及功能性方面,都有优势。
JetBrains AI 公布:深度整合自家 IDE,可聊天编程撰写文档
旗下拥有 IntelliJ IDEA、PyCharm 等多款 IDE 产品的 JetBrains 公司,昨日发布官方新闻稿,正式推出了 JetBrains AI 。据悉,这是一款专用于程序开发的 AI 工具,JetBrains 声称,这款 AI 拥有“生成代码”、“解释代码”、“回答代码相关问题”、“转换编程语言”等功能,号称能够“显著提高软件开发效率和质量”。
OpenAI首席执行官:我也讨厌ChatGPT这名字,但没法再改了
OpenAI首席执行官Sam Altman在周四的一次访谈中承认,他自己也不喜欢ChatGPT这个名字。奥特曼在知名脱口秀主持人特雷弗·诺亚(崔娃)的一档播客节目中表示:“这是一个可怕的名字,但它现在可能已无处不在,没法再改了。”奥特曼还向诺亚询问可能的替代名称,考虑将其缩短为“GPT”或“Chat”。但他后来承认,这个名字可能太过被人们熟知,无法改变了。
阿里旗下的夸克大模型通过备案
阿里智能信息事业群自研的夸克大模型已通过备案,夸克将陆续在通识、健康、创作等领域升级内容产品与智能工具,并落地一系列AIGC(生成式人工智能)创新应用,借助大模型能力全面升级夸克,提升用户在学习、工作、生活上的效率。
Stability AI 将向商业客户收取使用其最先进模型的费用,不再完全开源
上周,Stability AI 首席执行官 Emad Mostaque 在 X 上发布了一项重大声明,表示这家生成式 AI 公司将放弃以前的开源商业模式,并通过按月订阅的方式将其最先进的 AI 模型付费开放给企业用户。此举代表着快速创造更多收入的努力,因为该公司试图获得比其核心“模型即服务”产品更多的收入。
X 平台开始向其订阅高级版的用户推送使用 Grok AI 的权益
Grok 是由埃隆·马斯克的人工智能初创公司 xAI 开发的 ChatGPT 竞争对手,已在 X(原 Twitter)上正式推出。Grok 今天下午晚些时候开始向美国的X Premium Plus 用户推出,“Premium Plus”是 X 的订阅计划,每月花费 16 美元即可无广告地访问社交网络。X 表示,长期订阅者将优先访问 Grok,预计将于下周完成推送。
IDC:预计明年中国市场AI终端占比将达55%
IDC发布了2024年中国智能终端十大洞察报告,预计2024年中国市场上搭载AI功能的终端设备将超70%,AI终端占比将达55%。所谓AI终端是指处理器集成AI引擎的终端设备。IDC认为,随着终端算力提升和AI加速引擎逐渐在处理器上集成,终端市场上AI部署逐渐从云向端侧扩展。
OpenAI 前董事 Toner 发声:开除 Altman 不是因为安全原因,而是出于不信任
已经离开 OpenAI 董事会的 Helen Toner 公开发声,对于外界关于此前 Altman 被罢免事件的诸多疑问和“知情人士消息”做出一些回应。Toner强调,开除 Altman 是信任问题,跟AI安全没关系。知情人士称,Altman 试图说服董事会开除 Toner 的行为,引发了董事会对他的不信任。
Dojo超算项目被曝更换负责人,恐影响特斯拉的自动驾驶技术
知情人士透露,特斯拉公司Dojo超级计算机的项目负责人Ganesh Venkataramanan已经于11月份离职。媒体分析认为,此次离职事件不仅给这个耗资巨大的项目带来了打击,还让特斯拉的自动驾驶技术遭遇新的挫折。
传苹果将对麦克风重磅升级,iPhone 16或成公司首款AI手机
郭明錤表示,鉴于生成式人工智能在2023年爆红的势头,不难预测苹果公司将会在iPhone 16中推出相关的创新功能。他补充称,语音输入将是AI的关键接口,因此强化Siri的软件和硬件的功能和规格是推广AIGC的关键。
思科推出 Cisco AI Assistant 安全助理,可智能设立防火墙规则防止黑客攻击
据思科官方新闻稿,思科日前推出了一款安全工具 Cisco AI Assistant,号称可帮助用户管理防火墙规则,防止黑客趁虚而入。据悉,用户可在思科防火墙管理中心(Cisco Firewall Management Center)中,启用 Cisco AI Assistant 相关功能,用户将看到一个类似 ChatGPT 的界面,之后可在对话输入框中自由询问 AI 安全问题。
2023年12月7日·周四
英特尔:新一代酷睿Ultra处理器已适配超10款国内大模型
英特尔中国区技术总经理高宇在联想集团“AI PC产业创新论坛”上透露,新一代酷睿Ultra处理器已适配超10款国内大模型。英特尔在AI算力解决方案上采取XPU策略,即GPU、NPU和CPU“三重奏”。“大语言模型在英特尔CPU上已成功部署,运行速度流畅,未来将会在英特尔NPU上实现部署。英特尔会继续加强与联想集团等国内产业链的合作。”高宇称。
全球最大的资管公司贝莱德计划下月向客户推出生成式 AI 工具
全球最大的资管公司贝莱德日前透出消息,计划在明年1月向客户推出生成式人工智能(AI)工具。据报道,贝莱德周三在一份员工备忘录中写道,该公司已经利用生成式人工智能技术为其 Aladdin 和 eFront 风险管理系统构建了人工智能助手,它能够帮助客户从相关系统中提取所需要的信息。
商汤科技 AI 编程助手“代码小浣熊 Raccoon”开放公测,支持 IDE 插件
商汤科技宣布,基于商汤自研大语言模型的智能编程助手 —— 代码小浣熊 Raccoon,即日起开放公测。 代码小浣熊Raccoon 支持 Python、Java、JavaScript、C++、Go、SQL 等 30+ 主流编程语言和 VS Code、IntelliJ IDEA 等主流 IDE(集成开发环境)。
谷歌 Gemini 发布后遭质疑:测试标准有失偏颇,效果视频疑似剪辑
谷歌 Gemini 凌晨发布后吸引了巨大的关注,但有网友指出,MMLU测试中,Gemini 结果下面灰色小字标称 CoT@32,展开来代表使用了思维链提示技巧、尝试了32次选最好结果。而作为对比的GPT-4,却是无提示词技巧、只尝试5次,这个标准下Gemini Ultra其实并不如GPT-4。此外,机器学习讲师 Santiago Valdarrama 认为 Gemini 的演示视频展示的是精心挑选的好结果,而且不是实时录制而是剪辑的。
春晚吉祥物“龙辰辰”被疑AI生成,官方紧急澄清
12月6日,中央广播电视总台2024龙年春晚吉祥物形象“龙辰辰”正式发布亮相,然而,这张“定妆照”却被指是AI作图、抄袭。春晚官方账号随即在12月7日凌晨火速回应,“真的是设计老师一笔笔画出来的”,并以录屏的形式晒出了部分设计线稿和上色成图。
SK海力士成立新部门负责人工智能芯片业务
全球第二大存储芯片制造商韩国SK海力士公司周四表示,将成立一个名为AI Infra的新部门,负责人工智能(AI)半导体相关业务,这是该公司将更多地专注于高需求高端芯片的战略的一部分。
TCL 华星发布全球首款半导体显示垂直领域大模型:星智 X-Intelligence
在今天上午举行的 TCL 华星全球显示生态大会期间,TCL 华星发布了全球首款半导体显示垂直领域大模型 —— 星智 X-Intelligence。官方表示,该大模型由 TCL 华星联合智谱 AI、国家新型显示技术创新中心研发,并与清华大学进行合作,目前已经实现私有化部署。
《麻省理工科技评论》专访谷歌CEO皮查伊:Gemini只是起步,微调还能让它更强
在Gemini发布前夕,「MIT Technology Review」(《麻省理工科技评论》)杂志在谷歌位于加州山景城的办公室采访到了皮查伊,与他讨论了Gemini对谷歌、其产品、人工智能以及整个社会的深远影响。腾讯科技AI未来指北将该采访全文翻译为了中文,感兴趣的朋友可以点击阅读。
欧盟各方已就人工智能监管的全面规则基本达成一致,《人工智能法案》接近达成
消息人士透露,在经历了数月的谈判后,欧盟各方已经就人工智能监管的全面规则基本达成一致,有望推动《人工智能法案》正式生效。一旦正式立法,该法案将成为全球首个人工智能领域的全面性立法,同时也是全球人工智能监管的重要里程碑。
麦当劳与谷歌合作,2024 年起将部署人工智能以提供更新鲜的食物
麦当劳宣布与谷歌合作,将于 2024 年开始部署生成式人工智能技术,届时将有“数千家”餐厅进行硬件和软件升级。除了升级自助点餐亭和手机应用程序等其他系统外,麦当劳还将利用生成式 AI 技术对海量数据进行优化,从而提高餐厅运营效率。麦当劳表示,其中一个成果将是为顾客提供“更热、更新鲜的食物”。
Meta 推出独立的 AI 图像生成器,目前免费但只支持英文提示词
Meta 公司x宣布推出全新的、独立的 AI 图像生成器 —— Imagine with Meta ,允许用户通过自然语言描述来创建图像。据介绍,新的人工图像生成器由 Meta 现有的 Emu 图像生成模型提供支持,可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用(后续是否收费未知),并且每个提示都会生成四个图像。
AMD发布两款高性能AI芯片:Instinct MI300X 和 Instinct MI300A
在加州举行的发布会上,AMD发布了两款高性能AI芯片,将目标直接对准英伟达。Instinct MI300X是传统的GPU加速器方案,晶体管数量多达1460亿个,是AMD投入生产的最大芯片。Instinct MI300A是世界上第一个数据中心APU,将与英伟达的Grace Hopper Superchips直接竞争。AMD新芯片的客户包括微软、甲骨文以及Meta等巨头,预计2027年AI芯片市场可能会增长到4000亿美元。
谷歌正式推出迄今为止规模最大、能力最强的全新大语言模型 Gemini 1.0
当地时间12月6日,谷歌 CEO 桑达尔・皮查伊官宣 Gemini 1.0 版正式上线。这次发布的 Gemini 大模型是原生多模态大模型,是谷歌大模型新时代的第一步,它包括三种量级:能力最强的 Gemini Ultra,适用于多任务的 Gemini Pro 以及适用于特定任务和端侧的 Gemini Nano。
谷歌 AI 聊天机器人 Bard 升级更新,将由 Gemini 模型驱动
Bard 是谷歌公司的生成式 AI 聊天机器人和 ChatGPT 的竞争对手,今天获得更新,该公司声称这将大幅增强其功能。该公司表示,Bard 现在将由 Google 最新、最先进的人工智能模型 Gemini 提供支持,为聊天机器人提供更先进的推理、规划、理解和其他功能。
OpenAI 首席执行官 Sam Altman 被《时代》周刊评为年度 CEO
当地时间周三,OpenAI 首席执行官萨姆・阿尔特曼(Sam Altman)被《时代》周刊评为年度 CEO。除了阿尔特曼之外,泰勒・斯威夫特被评为“年度人物”;莱昂内尔・梅西被评为“年度最佳运动员”。
2023年12月6日·周三
英国央行表示,将在2024年考虑人工智能带来的金融稳定风险
英国央行周三警告称,人工智能(AI)的广泛应用可能会给金融体系带来系统性风险,并表示将在2024年评估并研究如何抵御这一威胁。尽管英国央行表示,人工智能和机器学习可以为英国金融服务带来巨大的好处,但它也强调,监管机构应确保企业对人工智能潜在危险有充分的监督和控制。
2023 年英文维基百科词条榜出炉,ChatGPT 以 4949 万浏览量领衔
维基百科基金会日前发布新闻稿,介绍了 2023 年英文维基百科的访问数据信息,其中英文维基百科今年的总浏览量超过 840 亿次。得益于今年 AI 风口,2023 年英文维基百科上阅读次数最多的词条是“ChatGPT”,浏览量为 4949 万。
英伟达CEO黄仁勋:将为中国市场提供符合美国规定的新产品,称华为是AI芯片领域的强大竞争对手
正在新加坡访问的英伟达首席执行官黄仁勋表示,中国市场占英伟达销售额的20%左右,英伟达将为中国市场提供一套符合美国政府最新规定的新产品,并表示在生产“最好的”人工智能芯片的竞赛中,华为是英伟达“非常强大”的竞争对手之一。
最新研究:AI 可以快速预测工业材料中的晶体方向
据报道,由日本名古屋大学的科学家领导的一个研究小组开发了一种人工智能工具,可以快速预测工业材料中的晶体方向,为更有效地利用多晶组件铺平了道路。这对于太阳能电池、智能手机和电脑中使用的硅晶体尤为重要。工业中使用的常见材料含有多晶成分,包括金属合金、陶瓷和半导体。
消息称台积电自研聊天 AI tGenie 已投入运营,上线半年节省 1 亿新台币翻译费
据台媒工商时报报道,台积电日前自行开发了一款聊天 AI 工具“tGenie”,这款 AI 已经于今年 5 月上线,号称已帮台积电省下 1 亿元新台币(当前约 2270 万元人民币)外包翻译费用。该 AI 基于英伟达芯片平台打造,未来多家代工厂也有望跟随台积电步伐,将此类生成式 AI 带入生产环节。
苹果推出 MLX 深度学习框架:专为 Apple Silicon 优化,可实现“软硬结合”
苹果今日推出了为 Apple Silicon 芯片优化的 MLX 深度学习框架,号称能够简化 Mac、iPad、iPhone 平台研究人员设计和部署模型的过程。来源: IT之家 调查显示,仅 10% 企业在过去一年采用了生成式 AI 解决方案 由英特尔公司旗下专注于 AI 和大型语言模型(LLM)平台的 cnvrg.io 进行的 2023 年 ML Insider 调查显示,过去一年中只有 10% 的企业组织将生成式 AI(GenAI)解决方案整合到生产中。
AI概念炒作泛滥?美国SEC主席警告:别滥用AI虚假宣传
美东时间周二,美国证券交易委员会主席加里·詹斯勒警告企业,不要滥用人工智能概念来进行虚假包装,即所谓的“AI washing”。詹斯勒表示,美国证券法禁止虚假宣传,并要求公司提供“全面、公平和真实”的信息披露。
国家超算广州中心发布新一代国产超算“天河星逸”
在今日举行的 2023 年超算创新应用大会上,国家超算广州中心正式发布新一代国产超级计算系统“天河星逸”。据悉,“天河星逸”以应用为中心,采用国产先进计算架构、高性能多核处理器、高速互连网络、大规模存储等关键技术构建,全面满足高性能计算、AI大模型训练、大数据分析等应用场景需求。
麦肯锡:人工智能可为华尔街带来每年高达3400亿美元利润
咨询公司麦肯锡表示,银行使用生成式人工智能工具可以通过提高生产率每年增加高达3400亿美元的利润。根据麦肯锡全球研究院周二发布的报告,这相当于经营利润增长9%至15%。报告作者称,企业银行和零售银行会受益最大。
马斯克的 AI 初创公司 xAI 接近完成一轮 10 亿美元融资
埃隆・马斯克旗下的人工智能初创公司 xAI 日前向美国证券监管机构提交文件,计划通过股权融资筹集高达 10 亿美元(当前约 71.4 亿元人民币)资金。根据周二的文件显示,该公司已经通过股权融资筹集了 1.347 亿美元,总融资额为 10 亿美元。
微软公布 Copilot 下一步计划,将支持 GPT-4 Turbo 和新的 DALL-E 3 模型
微软宣布 Copilot 将持续实现创新,如 OpenAI 的 GPT-4 Turbo 和最新的 DALL-E 3 模型。Copilot 很快将能够使用 OpenAI 最新的 GPT-4 Turbo 生成响应,使您能够处理更复杂和更长的任务,例如编写代码等。微软表示,该模型目前正在对部分用户开放测试,并将在未来几周内广泛集成到 Copilot 中。
微软必应搜索引擎新增加 Deep Search 深度搜索实验功能
微软宣布推出 Deep Search,这是其 Bing 搜索引擎的一项新实验功能,旨在为复杂的搜索查询提供更全面、更相关的结果。据微软称,Deep Search 解决了搜索中的一个常见痛点:当用户提出具体、细致入微的问题时,典型的搜索引擎通常无法完全理解问题或返回足够的答案,而 Deep Search 则可通过利用大模型来更详细地解析查询来解决这个问题。
2023年12月5日·周二
AI的星星之火是如何燎原的?始于生日派对上马斯克与佩奇的一场激辩
腾讯科技翻译了《纽约时报》周日发表的一篇深入探讨 DeepMind、OpenAI 和 Anthropic 成立故事的文章「 Ego, Fear and Money: How the A.I. Fuse Was Lit 」。故事起源于2015年马斯克44岁的生日派对上,他与谷歌联合创始人拉里·佩奇就AI的不同立场产生严重分歧,甚至终结了十多年的友谊。佩奇认为人类最终将与AI机器融合,将会有许多种智能争夺资源, 马斯克则担心机器可能会毁灭人类。这一看起来八卦的轶闻,却为后续 DeepMind、OpenAI 和 Anthropic 等 AI 明星公司之间的恩怨情仇拉开了序幕。
Meta、IBM 牵头成立“人工智能联盟”,以推动开源性人工智能的发展
在Meta和IBM的牵头下,AMD、英特尔、甲骨文等全球50多家公司、组织和学术机构共同创建了行业组织——人工智能联盟。该联盟希望推动开源性人工智能工作,降低 OpenAI 一家独大的风险。
美图推出 AI 视觉大模型 Miraclevision 4.0 版本并开放商业 API
今日,在美图创造力大会现场,美图自研AI视觉大模型 MiracleVision(奇想智能) 发布4.0版本,最新版本带来了两大新能力:AI 设计和 AI 视频。MiracleVision4.0还推出了全新的视觉模型商店,用户可以根据需要选择不同的视觉模型,创造出各种前所未有的视觉效果。MiracleVision4.0将于2024年1月陆续应用于美图旗下产品,同时开放商业 API,并提供多个套餐供用户选择。
美图与站酷联合发布《2023 年度 AI 设计实践报告》
今日,在美图创造力大会现场, 美图与站酷共同发布《2023 年度 AI 设计实践报告》, 助力设计师更好地适应充满机遇与挑战的 AI 时代。该报告共调研 5034 人, 其中专业设计师占 46.3%, 同时也涵盖了新媒体运营、电商运营、KOL 等群体。报告围绕 AI 设计在中国的普及程度如何、大家都用 AI 来设计什么、AI 设计工具的三大痛点、AI 设计商业落地案例、未来趋势与建议五个方面进行调研。
知网 AI 生成文本检测新专利公布,提高论文代写判定效率
爱企查 App 显示,近日,同方知网数字出版技术股份有限公司申请的“一种 AI 生成文本的检测方法、装置、介质及设备”专利公布。摘要显示,该发明可以判定待检测文本是否为 AI 生成文本,从而能够自动检测文本是否为 AI 生成文本,不仅检测效率高,而且不受审核人员的主观影响,使得检测结果更加准确。
AI 平台 Hugging Face 现 API 令牌漏洞,黑客可获取微软、谷歌等模型库权限
安全公司 Lasso Security 日前发现 AI 模型平台 Hugging Face 上存在 API 令牌漏洞,黑客可获取微软、谷歌、Meta 等公司的令牌,并能够访问模型库,污染训练数据或窃取、修改 AI 模型。
量子计算突破:IBM推出新型模块化系统,瞄准2033年超级计算机
IBM推出其第一台模块化量子计算机“IBM量子系统二号”。该公司展示了一种新方法,将机器内部的处理器连接在一起,然后将机器连接在一起,以形成模块化系统,当与新的纠错代码相结合时,有望在2033年生产出引人注目的量子机器。
Canalys预测:2024年全球个人电脑市场将增长8%
Canalys研究报告认为,全球个人电脑出货量在连续七个季度下跌后有望迎来复苏。在节日旺季和宏观经济改善的推动下,预计2023年第四季度市场将增长5%。展望未来,2024年全年出货量预计达到2.67亿台,较2023年增长8%,这主要得益于Windows的更新周期,以及具备AI功能和采用Arm架构电脑的崛起。
OpenAI 首席运营官:不要期待人工智能一夜之间带来实质性的商业变革
OpenAI 首席运营官Brad Lightcap表示,人工智能最被过度炒作的部分之一就是“可以一举带来实质性的商业变革”。Lightcap指出,许多公司接触OpenAI,期待生成式AI能解决许多问题,大幅削减成本,并在他们的业务陷入困境时带来增长。他说,尽管AI还有进一步提升的空间,但“永远不会有一项AI技术能完全解决这些问题”,并且这项技术仍处于起步阶段。他补充说,AI仍处于实验阶段,尚未成为关键工具和应用程序的一部分。
OpenAI 首席运营官谈 ChatGPT、AI发展方向、Altman
OpenAI 首席运营官 Brad Lightcap 近日接受媒体 CNBC 采访时,对ChatGPT、人工智能行业,以及公司运营细节进行了说明。Lightcap 指出,世界是如此的庞大和混乱,而人工智能系统仍在不断发展,它们仍处于起步阶段。OpenAI目前并不以盈利为核心,而是非常看重ChatGPT能否成为开发人员真正有用的工具。
最新研究显示 AI 可以根据人脑电波重建图像,准确度超过 75%
据日本《每日新闻》报道,科学家们首次能够使用人工智能 (AI) 仅根据人的大脑活动重建图像,准确率超过 75%。来自日本量子科学技术研究所(QST)和其他组织的研究人员团队已经证明,在某种程度上,仅基于思维就可以重建各种图像,例如风景和复杂的图形。测试者在观看 1200 张不同的图像后,让人工智能记录其回想时的磁共振功能成像大脑活动并重建图像,准确率达到了 75.6%。
美国商务部长雷蒙多警告英伟达不要为中国提供人工智能芯片
美国商务部长吉娜·雷蒙多在里根国防论坛上发表讲话,呼吁为出口管制提供更多资金,以阻止中国获得先进半导体。雷蒙多强调,负责管理这些控制措施的工业和安全局需要更多资金。她还强调,美国公司必须适应国家安全优先事项,即使这意味着短期内失去销售。雷蒙多在演讲中还批评芯片制造商英伟达专门为中国市场设计AI芯片,此前,美国已于 2022 年 10 月实施了第一轮出口限制。
瑞典金融科技独角兽 Klarna 暂停招聘,称 AI 提高了生产力
提供先买后付服务的瑞典金融科技独角兽 Klarna 宣布将冻结招聘,不再招聘处工程部门以外的新员工。该公司首席执行官 Sebastian Siemiatkowski 表示由于人工智能的兴起,使用 ChatGPT 等工具提高了生产力,公司现在只需要“更少的人来做同样的事情”。
2023年12月4日·周一
百度智能云发布基于文心一言的AI原生应用“超级助理”
据百度智能云官微,12月4日,百度智能云发布基于文心一言的AI原生应用——“ 超级助理 ”,并已正式开启公测。超级助理能够以 Web Copilot(浏览器插件)的形态进行使用,未来,超级助理还会推出独立PC端和移动端应用。此外,百度智能云将陆续推出超级助理行业版。
Meta 推出 Seamless Communication AI 翻译套件:支持近百种语言输入、同声延迟仅 2 秒
Meta 日前公布了 AI 翻译套件 Seamless Communication,该套件由 4 款 AI 模型组成,Meta 声称,该 AI 套件能够“精准再现说话者情绪”,可实现延迟仅 2 秒的同声传译能力、并支持近百种语言输入。据悉,Seamless Communication 是 Meta 庆祝自家 AI 研究机构“Fundamental AI Research”成立 10 周年所发表的研究成果。
Meta 推出 AI 音频模型 Audiobox:支持语音及文字同时输入、可生成多层次声音
Meta 日前推出了一款 AI 声音生成模型 Audiobox,能够同时接收语音及文字输入,用户可同时使用语音及文字描述,让这款模型生成所需的音频。据悉,这款模型基于 Meta 今年 6 月推出的 Voicebox AI 模型,据称 Audiobox 能生成各种环境音、自然对话语音,并整合了音频生成和编辑能力,以便于用户自由生成自己所需的音频。
字节跳动联合中科大提出多模态文档大模型 DocPedia
字节跳动与中国科学技术大学联合研究的多模态文档大模型 DocPedia 成功突破现有模型分辨率极限,达到2560×2560,相较于现有先进模型有显著提升。DocPedia不仅能准确识别图像信息,还能结合用户需求调用知识库回答问题,展现了高分辨率多模态文档理解的强大能力。
马斯克在 2018 年离开 OpenAI 之前曾让该公司加快研究步伐
据《纽约时报》报道,埃隆·马斯克在离开 OpenAI 之前表示该公司需要加快工作进展速度,这似乎与其后续对AI的谨慎态度相反。马斯克于 2015 年共同创立了 OpenAI,但于 2018 年离开 OpenAI,理由是与他在特斯拉的工作存在利益冲突。今年三月,马斯克签署了一封公开信,呼吁暂停人工智能开发六个月。
消息称字节跳动将推出 AI 开放平台,允许用户自创聊天机器人
据南华早报报道,字节跳动将推出一个开放平台,允许用户自主创建自己的聊天机器人,这一举措是为了在激烈的生成式人工智能竞争中迎头赶上。据字节跳动内部备忘录显示,这个名为“机器人开发平台”的项目计划在本月底推出公开测试版。此前,字节陆续上线AI聊天机器人 豆包 、 小悟空 ,以及面向海外用户的 ChitChop 。
华硕将于12月15日发布首批搭载英特尔酷睿 Ultra 处理器的 AI 笔记本
ASUS 华硕今日上午宣布,2024 华硕酷睿 Ultra AI PC 轻薄本新品发布会将在 12 月 15 日 15:00 举行,届时华硕灵耀系列笔记本新品也将登场。
阿斯利康与 AI 生物制药公司 Absci 签署 2.47 亿美元协议,合作开发抗癌药物
据英国《金融时报》周日报道,英瑞制药商阿斯利康与美国人工智能(AI)生物制药公司 Absci 签署了一项价值高达2.47亿美元的协议,以设计一种抗癌抗体。报告称,此次合作旨在利用 Absci 的人工智能技术进行大规模蛋白质分析,以找到可行的肿瘤疗法,这是阿斯利康的主要关注点。
OpenAI 5100万美元大额芯片采购意向书曝光,供货公司股东之一为Altman
据爆料,在2019年时,OpenAI 与其 CEO Sam Altman 持股的初创公司 Rain AI 签订了采购意向书,将在后者芯片上市后购买价值5100万美元的芯片。Rain AI研发的芯片被称为NPU,声称其将比英伟达的GPU更省电且更适配人工智能模型的定制。
Meta 首席科学家杨立昆驳黄仁勋:超级智能不会很快到来
Meta的首席AI科学家、深度学习先驱、图灵奖得主杨立昆(Yann Lecun)认为,如果人类想要训练出一种具备人类水平感知能力和常识的人工智能系统,还需要几十年的时间。这与英伟达CEO黄仁勋所预言的“超级人工智能将在五年内赶超人类”截然相反。
2023年12月3日·周日
GoogleX创始人预警:三年内,AI能在所有领域与人类智力工作者媲美
近日,在钛媒体2023T-EDGE全球创新大会·加州分会场上,谷歌无人车之父、Google X实验室创始人、Sage AI Labs首席执行官塞巴斯蒂安·特伦(Sebastian Thrun)就新一轮人工智能所引发的革命,首次发出全新的重磅预警。在题为《人工智能新时代》的主题演讲中,基于在人工智能领域20多年的深耕,特伦表示,未来三年内,文中提到的五大需要依靠人类智力的工作领域将会被颠覆,我们将看到AIGC在所有领域中都能与人类的智力工作者媲美。
测试结果显示,向 ChatGPT 提问时承诺提供“小费”会得到更详细回复
在不少使用英语的国家和地区比较盛行“小费”(tip)文化,顾客通常会向服务提供者支付小费来换取更佳的服务。一名博主 thebes 在 X 平台发布了自己的实验结果,配图显示,在向 ChatGPT 提问之后,是否提供或提供不同金额的“小费”确实会对 ChatGPT 的表现产生影响。
消息称谷歌 CEO 推迟 Gemini 模型发布计划,因无法可靠处理部分非英语查询
据 The Information 当地时间周六报道,两位知情人士透露称谷歌已经悄然将自家 AI 大模型 Gemini 的公开亮相时间推迟到了明年 1 月。而在此之前,Gemini 的“首秀”和一系列相关活动原计划下周在加州、纽约和华盛顿等地举行。
马斯克:将逐步向 X Premium+ 订阅用户开放 Grok AI
马斯克旗下的人工智能初创公司 xAI 上个月推出了其首款 AI 助手 —— Grok 。马斯克表示,Grok 将直接包含在 𝕏 的 Premium+ 订阅服务中,其访问权限将在未来一周左右慢慢向用户开放,而优先级取决于订阅时间。当然,现有 𝕏 用户可以每月花费 16 美元或每年 168 美元来进行订阅。
爱奇艺孙斌:AI拆解剧本的准确率超过了90%
爱奇艺副总裁孙斌在钛媒体2023T-EDGE全球创新大会,发表演讲时称目前爱奇艺已经在内容策划、开发、制作、宣发等核心环节开始应用生成式AI。例如在开发环节,生成式AI辅助人工阅读,将3-4天的阅读时间缩短至1小时左右,对剧本的场景和人物拆解的准确率也超过了90%。
张宏江:所有产业都将被AIGC重写,完全自动驾驶将有望实现
张宏江在钛媒体2023T-EDGE上强调,AI 大模型作为基础平台,将会系统性推动所有产业进入新范式,成为下一个时代的“超级入口”,重写所有软件应用和产业,提升每个领域的生产力。未来1.5年-2年,人类或将可以看到大规模商业落地曙光。
2023年12月2日·周六
员工称亚马逊 AI 聊天机器人 Q “幻觉”严重,且泄露公司机密数据
亚马逊于前几日推出名为 Q 的 AI 聊天机器人,不过根据国外科技媒体 Platformer 披露的一份内部文件,亚马逊员工称 Q 存在严重的“幻觉”问题,并泄露了包括 AWS 数据中心位置、内部折扣计划等诸多机密信息。
AI 同声传译新突破,谷歌发布 Translatotron 3 模型:可绕过文本转换步骤
谷歌今天发布新闻稿,正式介绍推出了名为 Translatotron 3 的新 AI 模型,无需任何并行语音数据下,可以实现语音对语音的同声传译翻译。研究人员称,Translatotron 3 实现“第一个完全无监督直接语音到语音翻译的端对端模型”。
微软 Copilot 结束预览版,正式上线该 AI 助手
微软今天发布新闻稿,于今年 2 月推出 Copilot (此前叫 Bing Chat 和 Bing Chat Enterprise)预览版以来,成为了很多人的日常 AI 伴侣,现在摘掉预览的帽子,正式上线。微软表示 Copilot 在摘掉预览的帽子之后,将继续成为您的日常 AI 伴侣,提供 AI 驱动的网络聊天体验。
OpenAI 将 GPT Store 上线时间推迟到明年年初
OpenAI 在发给 GPT Builder 注册用户的电子邮件中表示,该公司的 GPT 商店将推迟到明年年初。OpenAI 在电子邮件中表示,“意外的事情让我们很忙”,这推迟了 GPT 商店的推出。该公司表示,原计划于 12 月推出该商店,这本身比最初承诺的时间稍晚;在 11 月份的开发者大会上,OpenAI 表示该商店将于当月晚些时候推出。
ChatGPT 移动端 App 超 1.1 亿安装,半年收入接近 3000 万美元
据移动应用数据分析平台 Data.ai(原App Annie)报告,ChatGPT 移动端应用程序已超过 1.1 亿次安装量,累计订阅收入达 2860 万美元(注:ChatGPT Plus订阅费为19.9美元每月)。据悉,在网页版上线六个月后,ChatGPT 原生移动版本在 iOS 上发布,两个月后 Google Play Android 版本也随之发布。
摩根士丹利预测智能手机销量将因人工智能的增长而反弹
投资银行摩根士丹利的报告预测,全球智能手机出货量将在 2024 年反弹近 4%,在 2025 年反弹 4.4%,摆脱和 PC 行业多年低迷的状况。摩根士丹利表示,推动智能手机转型的将是新的设备人工智能功能,释放新的需求。该投资银行上调了对 2025 年全球手机销量的预测,理由是所谓的端侧人工智能具有巨大潜力,可以在保护用户隐私的同时实现从增强摄影到语音识别的进步。
来源: TechCrunch
欧盟AI法案或被搁置,基础模型监管据称是矛盾焦点
据媒体援引消息人士报道,由于难以就监管ChatGPT等系统达成一致,欧盟人工智能(AI)法案面临被搁置的风险。经过两年的谈判,欧洲议会今年6月通过了《AI法案》授权草案。该法案目前处于成员国、议会和欧盟委员会的三方谈判阶段,这一阶段的目的是确定最终版本的法案。若正式获得批准,该法案将成为全球首部关于AI的全面法规。
2023年12月1日·周五
人民网研究院发布《人形机器人技术专利分析报告》,相关专利中国第一
近日,人民网研究院官方发布 《人形机器人技术专利分析报告》 ,报告不仅覆盖全球范围内、涵盖整个技术体系、时间维度横跨超20年,整个人形机器人产业发展历程悉数在报告中展现。其中,中国在专利申请数量和有效专利数量上均是全球第一。中国企业优必选在人形机器人有效专利数量上是全球第一。
百度将上线“千帆AI原生应用开发工作台”,中国版GPTs要来了?
据悉,百度将于12月20日举办2023百度云智大会·智算大会,届时将正式上线一款AI原生应用开发产品——“千帆AI原生应用开发工作台”,帮助开发者大幅降低AI原生应用开发门槛,加速企业AI原生应用落地。据了解,百度早在10月17日的百度世界大会上发布了AI原生应用开发工作台产品,在即将举办的2023百度云智大会·智算大会上,该产品将正式全面开放。
张宏江:未来1.5年-2年,人类或将看到大模型规模商业化的曙光
2023T-EDGE全球创新大会上,智源研究院学术顾问委员会主任、美国国家工程院(NAE)外籍院士张宏江发表演讲时表示大模型将重塑所有的产业,提升所有领域的生产力,并在不断改进和自主化现有的模型下,有望改变整个产业形态。未来1.5年-2年,人类或将可以看到大规模商业落地曙光。
全球首个金融风控大模型国际标准出炉,由腾讯牵头制定
据腾讯安全公众号,11月30日,IEEE金融风控大模型标准启动会在深圳召开。该标准由腾讯主导发起,是全球范围内首个金融风险控制领域的大模型国际标准,旨在为金融机构风控建模环节中应用AI大模型技术提供参考和指引,使金融机构能够在日益复杂和数据驱动的金融环境中高效预测、衡量和管理业务风险。来源: 腾讯安全官微
昆仑万维发布「天工 SkyAgents」平台,零代码打造AI智能体
昆仑万维正式发布「天工SkyAgents」平台,借助该平台,用户可以通过自然语言和简单操作,无需代码编程,即可在几分钟之内部署属于自己的AI Agents,完成行业研究报告、单据填写、商标设计、甚至健身计划、旅行航班预定等多项私人定制需求。
阿里云宣布开源通义千问 720亿参数、18亿参数和音频模型
阿里云宣布开源通义千问 720 亿参数模型 Qwen-72B、18 亿参数模型 Qwen-1.8B 及音频大模型 Qwen-Audio,目前已上线阿里魔搭社区。本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向 72B、1.8B 对话模型提供了 4bit / 8bit 量化版模型,便于开发者们推理训练。
美国迫使沙特基金退出 Altman 参与投资的 AI 芯片初创公司
据媒体报道,美国强迫沙特阿美的风投基金 Prosperity7 退出AI芯片初创公司 Rain AI,这家硅谷公司的投资者包括 OpenAI 的 CEO Sam Altman。2022年,Prosperity7 在 Rain AI 的某一轮融资中领投,然而,美国“外国投资委员会”(CFI)评估并以“国家安全”为由,要求沙特基金公司卖出所持股份,Prosperity7 遂售出了所持股份。
OpenAI 仍坚持售股计划,将给员工额外一个月时间考虑是否参与
据媒体周四(11月30日)报道,多位知情人士透露,美国人工智能研究初创公司OpenAI仍坚持执行其售股计划。他们表示,OpenAI将“允许员工出售所持公司股票”的期限延长了一个月至2024年1月5日,先前截止日期为12月初。这意味着,公司给潜在的投资者额外一个月的决定时间。
微软总裁:Altman 被解雇和超级智能无关,短期内开发不出来
微软总裁 Brad Smith 表示,未来一年内不可能创造出达到超级智能水平的人工智能(AI),这需要耗时数年,甚至数十年。Smith 还否认了OpenAI首席执行官 Sam Altman 被罢免和超级智能有关的说法。
生成式 AI 游戏开发平台 Bitmagic 面向玩家开启测试
Bitmagic 今天宣布,其基于 AI 的生成式游戏开发平台现已通过封闭测试计划向公众开放。该平台可让每个人都成为游戏开发者,玩家可以通过在文本提示中输入描述,Bitmagic 会根据文字制作完全可玩的3D游戏。
AI 业务自动化初创公司 Kognitos 获 2000 万美元 A 轮融资
将生成式AI应用于商业自动化的初创公司 Kognitos 宣布完成 2000 万美元 A 轮融资,由 Khosla Ventures 领投,现有投资者 Clear Ventures、Engineering Capital、Wipro Ventures 参投。Kognitos 通过 AI 自动化为商业用户提供支持,减轻了商业用户和 IT 部门的负担,大幅降低了成本,同时加快了业务发展。
2023年11月30日·周四
英国迎来微软史上最大投资,25 亿英镑助力人工智能发展
英国政府表示,微软将在未来三年内向英国投资 25 亿英镑(当前约 226.5 亿元人民币),这是该公司迄今为止在英国的最大单笔投资,这将支撑未来人工智能(AI)的发展。
马斯克:OpenAI罢免奥特曼可能是发现了一些AI危险元素
当地时间11月29日,在DealBook峰会上,马斯克对于OpenAI最近的“政变”风波发表了自己的猜测。马斯克表示,虽然自己不清楚这场闹剧的内情,但他担忧这一切对于AI将意味着什么,并希望能够知晓旧董事会罢免奥特曼的真实原因。
魅族 Flyme 10.5 发布:AI 大模型加持全新 Aicy 助手,也支持 Auto 车机
在今日的 2023 魅族秋季无界生态发布会上,魅族发布了搭载全新 Aicy 助手的 Flyme 10.5 系统。据介绍,全新 Aicy 拥有 Flyme AI 大模型加持,拥有多项新的 AI 功能。Flyme AI 将于 12 月上旬开启内测。
智源研究院开源700亿参数大模型「Aquila2-70B-Expr」,基于英伟达及天数智芯完成训练
智源研究院正式开源700亿参数大模型Aquila2-70B-Expr(异构先驱版)。这是首个基于英伟达混合资源(A100集群+A800集群)、天数智芯混合资源(BI-V100集群+BI-V150集群)完成训练的大模型。
Amazon Bedrock 发布更多模型选择和全新强大功能
亚马逊云科技在2023 re:Invent全球大会上宣布,Amazon Bedrock发布更多模型选择和全新功能。据介绍,Amazon Bedrock是一项全面托管的服务,用户可访问来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI和亚马逊的多种大语言模型和其他模型,以及客户构建生成式AI应用程序所需的广泛的功能,包括确保隐私和安全的同时简化开发。
华为推出业界首个大模型混合云
据华为云官方消息,今天,以“践行深度用云,加速智能升级”为主题的华为云行业高峰论坛 2023 在北京开幕。会上,华为云推出业界首个大模型混合云,并发布《深度用云展望 2025》白皮书及深度用云行动计划,希望通过创新技术、理论沉淀及行动举措,助力政企践行深度用云,加速智能升级。
AI帮忙写邮件、管客户,阿里国际站旗下OKKI AI上线
记者从阿里国际站方面获悉,外贸 SaaS 工具 OKKI 将于12月1日正式上线AI版。OKKI AI面向全行业所有企业开放,主打客户管理、辅助决策两大核心能力。内测数据显示,用OKKI AI帮忙润色的推广邮件,发给海外客户后的回复率能提升32.12%。
马斯克:AI比核弹还要危险,需要政府监管
当地时间11月29日,马斯克在DealBook峰会上表示,“我们应该对AI实施某种监管,AI比核弹更危险,我们监管核弹,因为你不能在自家后院制造核弹。”来源: 澎湃新闻 AI 视频生成初创公司 HeyGen 获新一轮 560 万美元融资 总部位于洛杉矶的 AI 视频生成初创公司 HeyGen 宣布获得 560 万美元的新风险投资,由 Sarah Guo 的 Conviction Partners 领投,本轮融资估值为 7500 万美元。作为交易的一部分,Guo 将接替红杉中国担任董事会席位。
黄仁勋:AI可能在5年内超越人类智能,正为中国市场开发合规芯片
黄仁勋在DealBook峰会上表示,如果将人工智能(AGI)定义为在测试中与人类智能相比“具有相当竞争力”的计算机或软件,那么“在未来五年内,AI就可以完成这些测试”。黄仁勋还公开表示,中国是最大的芯片市场,英伟达正在为中国开发不会受到限制的产品。
英国政府发布一份AI对职业影响的研究报告,金融和保险行业最容易受到AI的影响
英国教育部未来技能部门的报告发现,金融和保险行业似乎最容易受到人工智能浪潮的影响,这也意味着那些雄心勃勃的伦敦金融城专业人士正处于风口浪尖之上。管理顾问是受所有人工智能应用影响最大的职业,紧随其后的是财务经理、会计师、心理学家、采购经理和经济学家。
摩根大通称AI工具已开始给公司创收,未来预计收益会更多
美国最大的银行——摩根大通表示,人工智能(AI)工具已开始为该行带来收入,未来人工智能领域的进步可能会带来更多收益。摩根大通去年设定了2023年人工智能创造10亿美元“商业价值”的目标,并在5月的投资者日将这一目标提高到15亿美元。尽管如此,小摩承认存在一些与新兴技术相关的风险。
Sam Altman 正式回归 OpenAI 出任 CEO:高管重排座次,微软进董事会
当地时间11月29日,OpenAI创始人萨姆·奥特曼(Sam Altman)和新董事会主席布雷特·泰勒(Bret Taylor)在给员工的备忘录中宣布,他将重新担任OpenAI首席执行官(CEO),曾任临时首席执行官的米拉·穆拉蒂(Mira Murati)将继续担任首席技术官(CTO),微软将在公司董事会中获得一个无投票权的观察员席位。
ChatGPT 又被曝漏洞:重复某词可曝出敏感信息内容
继“奶奶漏洞”之后,ChatGPT 又被曝出“重复漏洞”,而这次更为严重。谷歌 DeepMind 研究人员近日研究 ChatGPT 时,发现在提示词中只要其重复某个单词,ChatGPT 就有几率曝出一些用户的敏感信息。
谷歌 DeepMind 的新 AI 工具帮助创造了 700 多种新材料
今天在《自然》杂志上刊登的一篇文章介绍了谷歌 DeepMind 新的 AI 工具利用深度学习来加快发现新材料的过程,该技术被称为材料探索图形网络(GNoME),已用于预测 220 万种新材料的结构,其中 700 多种已在实验室中创建,新发现的材料可用于制造更好的太阳能电池、电池、计算机芯片等,目前正在接受测试。
Stability AI 推出 SDXL Turbo,可实时输入文本生成图像
Stability AI 发布了他们在文本到图像生成技术方面的最新创新——SDXL Turbo,该团队使用称为对抗扩散蒸馏的新技术,可以根据短文本提示实时创建详细的图像输出,同时保持高保真度。感兴趣的朋友,可以访问 Clipdrop SDXL Turbo 尝试。
消息称人工智能创企 Stability AI 正寻求出售,与投资方关系紧张
媒体称,上月Stability AI的主要投资者Coatue Management担心公司的财务状况,致信管理层呼吁让CEO下台,要求提供CEO等高管的薪酬详情,管理层面临资方越来越大的压力,因此考虑出售,近几周和多家公司磋商。
2023年11月29日·周三
麦肯锡:生成式AI每年将为中国释放2万亿美元经济效益
全球知名咨询公司麦肯锡(McKinsey & Company)日前表示,该机构相信投资行家们正准备在未来十年大举投资,推动中国企业的人工智能发展,每年的款项数额不仅将达到数万亿美元,还将成为中国经济增长的战略驱动力。麦肯锡的多名高管纷纷认为,人工智能和数字化将是中国企业能够脱颖而出的领域,生成式人工智能每年可以在中国进一步释放价值2万亿美元的经济效益。
英国政府报告称不少英国教师为省时用人工智能备课改作业
英国政府日前发布的一份报告显示,不少英国教师会在工作中使用人工智能(AI)工具以节约时间。据英国《每日邮报》28日报道,这次调查共收到来自中等以及高等教育机构的567名教师回复。结果显示,老师会使用包括ChatGPT在内的AI工具批改作业、给学生写邮件、写评语、在社交媒体发帖等。一名老师甚至利用AI技术开发了一个平台,专门用于对学生进行评估和提供反馈。另外,还有老师利用AI工具帮助学生解释概念、举例子等。
《北京市人工智能行业大模型创新应用白皮书(2023年)》发布
北京市科学技术委员会、中关村科技园区管理委员会在AICC 2023人工智能计算大会上发布了《北京市人工智能行业大模型创新应用白皮书(2023年)》。《白皮书》从大模型全球发展态势、国内外行业应用概述、北京应用情况和发展建议等方面进行了系统分析和阐述,旨在进一步推动大模型应用落地,展示北京市大模型应用成果,促进大模型价值传播和供需对接。
深度学习框架 Keras 3.0 发布,支持 TF/PyTorch/Jax 无缝混合使用
被 250 多万开发者使用的深度学习框架 Keras 3.0 正式发布,被誉为改变了机器学习游戏规则:不仅支持 TensorFlow、PyTorch、Jax 三大框架作为后端,还能在它们之间无缝切换,甚至混合使用。使用 Keras 3 可以创建在任何框架中都能以相同方式工作的组件,允许访问跨所有后端运行的 keras.ops 命名空间。
亚马逊 AI 编程工具 CodeWhisperer 正式版推出,可检测代码中存在的漏洞
亚马逊在去年 6 月推出了 AI 编程工具 CodeWhisperer 的预览版,而在今日的“AWS re:Invent 2023”活动中,亚马逊公布了 CodeWhisperer 的正式版本。亚马逊声称,开发人员经过一年多的改进,为 CodeWhisperer 加入多项新功能,包含“发现和修复代码漏洞”的能力,新增了“基础架构即代码(Infrastructure as Code,IaC)”支持,允许 Visual Studio 2022 使用。
微软推出跨平台框架 ML.NET 3.0 版本:强化深度学习功能、加强 AI 计算效率
微软日前宣布推出跨平台机器学习框架 ML.NET 3.0,主要强化了深度学习功能,改进 ML.NET 数据处理能力,并添加了英特尔 oneDAL 加速训练技术,以及自动机器学习等功能。
马云内网发言:AI电商时代刚刚开始,对谁都是机会、也是挑战
澎湃新闻记者从阿里多名员工处确认,马云在阿里内网回复员工提到拼多多市值逼近阿里的帖子时表示,AI电商时代刚刚开始,对谁都是机会,也是挑战,“我更坚信阿里会变,阿里会改。”
华尔街大行争抢AI人才,高盛成输家,人才净流失规模最大
华尔街各大行近一年以来掀起AI人才争夺战,数据显示,高盛过去12个月以来AI人才净流失达到60人,为各大行中最多。相比之下,富国银行、摩根大通的AI人才处于净流入状态。目前,美国AI相关岗位的年收入中位数已经达到90.1万美元。
能迅速模仿人类专家的智能体出现,未来AI或在社会中自行学习成长
据《自然·通讯》28日发表的一篇论文,谷歌 DeepMind 报道了一个人工智能(AI)体,在 3D 模拟中,该智能体能在第一次见到的任务中极迅速地模仿人类专家,实时可靠地获取来自人类搭档的知识。这一研究结果是对AI实现快速知识传播的一次概念验证,也是朝着人类—AI开放式互动的文化演变迈出的第一步。
智源研究院副院长:国内AI芯片的大模型训练性能与国外约有三年差距
北京智源人工智能研究院副院长、总工程师林咏华表示,当前中国AI芯片的大模型集群训练性能,只有个别接近英伟达A100/A800,大多数不到50%。此外是生态差距巨大,我国AI芯片公司有40余家,但中国AI芯片整体的市场占有率加起来不超过10%,各家AI芯片软件各异、生态十分零碎割裂。
字节大模型产品首出海,推出“ChitChop”人工智能助手
字节在海外上线了一款名为“ ChitChop ”的大模型产品,开发运营公司是POLIGON,字节旗下海外社交产品Helo同样由该公司运营,目前已上线独立APP和网页版。据悉,ChitChop是一个人工智能助理工具,可以为用户提供多达200+的智能机器人服务,通过提供创造性灵感、提高工作效率等方式来服务用户的工作和生活。
来源: Tech星球
报告:预计 2027 年中国人工智能加速服务器将达
134 亿美元 人工智能计算大会(AICC 2023)今日在北京举行,记者从会上获悉,国际数据公司IDC和浪潮信息联合发布《2023-2024年中国人工智能计算力发展评估报告》,《报告》显示,2023年上半年,中国人工智能服务器市场规模环比增长54.1%,预计2027年中国人工智能加速服务器将达到134亿美元,五年年复合增长率达21.8%。2023年上半年,中国人工智能服务器市场规模达到30亿美元,同比增长55.4%。
OpenAI 预计不会为微软和其他投资者提供董事会席位
据 The Information 报道,一位知情人士透露,OpenAI 重组后的董事会不打算吸纳外部投资者的代表,这表明董事会将优先考虑安全实践而不是投资者回报。新董事会尚未正式就任,情况可能会发生变化。但该人士表示,微软和 Khosla Ventures、Thrive Capital 和红杉资本(Sequoia Capital)等其他股东预计不会在 OpenAI 新的 9 人董事会中获得席位。
亚马逊 AWS 推出 AI 聊天机器人 Amazon Q 为企业提供服务
亚马逊在公司一年一度的 AWS Reinvent 大会上推出了名为 Amazon Q 的新型聊天机器人,旨在帮助企业和员工更好地利用亚马逊云服务(AWS)。Amazon Q 是一项新型生成式 AI 辅助服务,可以帮助员工快速利用公司的数据和专业知识获得问题答案、解决问题、生成内容等,可以根据企业客户的业务进行定制化。
亚马逊发布升级款AI系统处理器Trainium2 与英伟达拓展伙伴关系
亚马逊云计算部门AWS发布升级款自研芯片Graviton4,性能较上一代快30%,采用这款处理器的电脑将于未来数月上市。该公司还发布了面向AI系统的升级款处理器Trainium2,将于2024年投入应用,以取代英伟达的AI加速器产品。此外,亚马逊扩大与英伟达的伙伴关系,AWS将是Grace Hopper Superchip升级款产品的第一个大客户。
埃森哲宣布将收购意大利生成式人工智能公司 Ammagamma
全球专业咨询服务巨头埃森哲公布了收购 Ammagamma 的计划,Ammagamma 是一家专门从事人工智能和生成式 AI技术的意大利公司。作为收购的一部分,这家意大利公司将融入埃森哲欧洲人工智能高级中心不断壮大的人工智能专业人员网络,以寻找跨行业的人工智能应用。此举是埃森哲雄心勃勃的30 亿美元 AI 投资计划的一部分,旨在通过人工智能的广泛应用推动客户的数字化转型。
Post AI 视频生成和编辑初创公司 Pika 完成 5500 万美元融资
人工智能视频平台 Pika 宣布完成由 Lightspeed Venture Partners 领投的3500万美元A轮融资,加上该公司前六个月内通过 Nat Friedman 和 Daniel Gross 领投的种子前和种子轮融资总共筹集了 5500 万美元。此外 Pika 还推出了 Pika 1.0 版本,其中包括一个新的人工智能模型,可以生成和编辑各种风格的视频,如3D动画、动漫或电影。
2023年11月28日·周二
欧盟AI法案或于下月“落地”,谷歌高管:AI法规需要促进创新
谷歌全球总裁兼首席法律官肯特·沃克表示,管理人工智能(AI)的法律框架应该支持创新。在欧盟寻求于下月出台AI法案之际,沃克的表态代表了众多科技企业的诉求。欧盟国家和欧盟议员目前正在研究《AI法案》的最终细节,目标是在12月6日达成协议。
Hugging Face CEO 预测:2024 年 AI 行业六大巨变
全世界最大的AI开源社区 Hugging Face 的 CEO Clement Delangue 对 2024 年 AI 行业的发展做了6条具体的预测:1.某个当红的AI公司会倒闭,或者以极低的价格被收购;2.开源LLM能够达到最好的闭源LLM的能力水平;3.AI在视频、生物、化学、时间序列等领域将带来巨大突破;4.大众将更进一步关心AI在经济上和环境上的成本;5.某一个流行媒体的内容大部分将由AI生成;6.1000万Hugging Face上的AI开发者将会带来新的工作机会,不会导致失业的激增。
商汤遭海外做空机构指责人为夸大收入,回应称“不实、误读”
美国做空机构灰熊研究(Grizzly Research)发布针对商汤集团的报告,称商汤集团人为地夸大了收入。之后商汤回应《科创板日报》称:公司关注到该报告,其内容为拼凑的旧信息,包括大量不实陈述和对公司业务的误读。
微软安全主管:生成式AI将在网络安全领域“大展身手”
微软安全主管Vasu Jakkal指出,生成式人工智能对其网络安全业务至关重要。Jakkal称,微软可以用数据来训练其人工智能模型理解这些网络安全威胁。此外,网络生态系统的合作对于打击网络犯罪也至关重要。
Salesforce 与 AWS 宣布加强数据与人工智能领域的产品集成
AWS 在 2023 re:Invent 全球大会上宣布,与 Salesforce 扩展长期战略合作,深化数据和人工智能领域的产品集成,并首次将部分 Salesforce 产品上架 AWS Marketplace。该协议使客户能够在 Salesforce 和 AWS 之间管理数据,并将新的生成式AI技术融入到应用程序和工作流中。Salesforce 也将全面支持 Amazon Bedrock,可实现一个 API 即可调用多个来自领先AI公司的基础模型。
Omdia:英伟达 Q3 售出近 50 万个 A100 和 H100 AI GPU,Meta 和微软是最大买家
研究机构 Omdia 表示,英伟达 Q3 售出了近 50 万个 A100 和 H100 GPU,基于 H100 的服务器的交付周期已延长至 36 到 52 周。Omdia 认为,Meta 和微软是英伟达 H100 GPU 的最大买家,采购了多达 15 万个 H100 GPU,远远超过谷歌、亚马逊、甲骨文和腾讯购买的 H100 处理器数量(5 万个)。
美英等18国签署AI监管指南,敦促企业打造“从设计层面就重视安全”的AI系统
当地时间26日,包括美国、英国在内的18个国家签署并公布《安全人工智能系统开发指南》。参与签署的国家一致同意,应约束人工智能(AI)公司在开发与部署时“确保客户及公众的数据安全,并免遭滥用”。这份长达20页的非约束性文件中,主要内容包含了监控AI系统的滥用、保护数据不被篡改,以及审查软件供货商等等一般性建议,并称其将敦促企业打造“从设计层面就注重安全”的人工智能(AI)系统。
AWS 文本语音转录平台 Amazon Transcribe 更新,可为 100 种语言提供基于 AI 的生成式转录
在亚马逊 AWS re:Invent 大会期间,AWS 宣布为其 Amazon Transcribe 产品添加了新语言,为 100 种语言提供基于 AI 的生成式转录,可以识别更多口语并启动通话转录,并为客户提供了大量新的 AI 功能。据 AWS 称,Amazon Transcribe 在多种语言上的准确率达到 20% 到 50%。
生物科技初创公司 Cradle 获 2400 万美元 A 轮融资,将生成式AI技术用于蛋白质工程中
荷兰生物科技初创公司 Cradle 宣布已筹集 2400 万美元的 A 轮融资,使其总融资额达到 3300 万美元。该公司利用生成式人工智能帮助科学家设计和工程蛋白质,构建易于使用的基于网络的软件,任何科学家和实验人员团队都可以使用该软件,而无需生物信息学家或机器学习工程师的帮助。
微软透露将升级 Copilot 至 GPT-4 Turbo,并提高字符上限
微软 Windows 和 Web 体验团队的负责人 Mikhail Parakhin 近期在 X(推特)平台发布推文,表示团队正在积极改善 Copilot (Bing Chat),在解决某些问题之后,会升级到 OpenAI 的 GPT-4 Turbo 上。Parakhin 并表示升级后,字符限制数量会进一步扩充,目前最高输入字数为 4000 字。
人体实验在即,马斯克的脑机接口公司 Neuralink 再融资 4300 万美元
根据提交给美国SEC的一份文件显示,马斯克的脑机接口公司Neuralink公司又获得了4300万美元的风险投资。成立于2016年的Neuralink希望建立人脑与外部设备的通信通道,通过在大脑内植入超细线,并将这些线程连接到一个定制设计的芯片上,该芯片包含可以读取神经元组信息的电极。据报道,已有数千人正排队等候植入Neuralink的大脑植入设备。此外该公司计划到2030年将为超过2.2万人植入芯片。
原百度副总裁李硕创业,发布国内首个家庭服务产业大模型
原百度副总裁、智能云战略行业总经理李硕创业项目曝光,创立丽阳神州智能科技有限公司,并于近期发布了国内首款家庭服务产业大模型。丽阳神州家庭服务大模型已经初步具备了人机协同的潜能,能够将任务指令拆解并分发给智能设备。
阿里达摩院AI突破胰腺癌早筛难题,2万人中发现31例漏诊
日前,阿里巴巴达摩院联合全球十多家顶尖医疗机构,将AI用于体检中心、医院等无症状人群的胰腺癌筛查。只需要最简单的平扫CT,就在2万多真实世界连续病人群体中发现了31例临床漏诊病变,其中2例早期胰腺癌病患已完成手术治愈。相关研究成果登上了国际顶级医疗期刊《自然·医学》(Nature Medicine) ,该刊专门配发评论文章:“基于医疗影像AI的癌症筛查即将进入黄金时代”。
微软现已为 Win11 画图 App 引入 DALL-E 3 集成
微软现已开始向所有 Windows 11 用户推送集成 DALL-E 3 的“画图”应用。DALL-E 模型是 OpenAI 开发的图片生成模型,此前已在微软 Bing 的图像生成功能中使用。不过,该功能此前仅限于美国、法国、英国、澳大利亚、加拿大、意大利和德国的部分用户参与测试,目前还不清楚是否面向所有用户开放。
韦氏词典将“Authentic(真实)”评选为2023年度词汇 《韦氏词典》
(Merriam-Webster)公布其2023 年年度词汇为 Authentic (真实的)——这个词指的是我们比以往更多地思考、写作、渴望和判断。随着人工智能的兴起及其对深度伪造视频、演员合同、学术诚实和大量其他主题的影响,“真实”和“虚假”之间的界限变得越来越模糊。韦氏公司称在韦氏词典网站上查询“真实”一词的频率通常很高,今年全年查询量更是创新高。此前《柯林斯词典》公布其年度词汇为AI,而《剑桥词典》评选的年度词汇为Hallucinate(产生幻觉),都与人工智能相关。
2023年11月27日·周一
字节跳动成立新 AI 部门 Flow,发力 AI 应用层
36氪从多个独立信源处获悉,字节跳动近期成立了一个新AI部门Flow,技术负责人为字节跳动技术副总裁洪定坤。一位知情人士告诉36氪,这一新部门的业务带头人,为字节大模型团队的负责人朱文佳。
浪潮信息发布源2.0基础大模型,千亿参数全面开源
浪潮信息发布源2.0基础大模型,2.0模型包含三组参数,分别为1026亿、518亿和21亿,在编程、推理、逻辑等方面展示出了先进的能力。与源1.0相比,源2.0侧重通过模型结构的改进提高精度。
沃尔玛推出“识图购物”功能,利用 AI 辨识电视节目内物品并提供购买链接
沃尔玛日前联合串流平台 Peacock,推出一项名为“购买当下”的 AI 服务,主要通过 AI 识别出电视节目画面中的物品,并对比沃尔玛商品目录中类似商品,提供商品链接供消费者直接购买。
微软、谷歌 DeepMind 分别推出面向初学者的 AI 入门课程
近日谷歌和微软几乎同时发布了自家关于AI教育的课程。Google DeepMind 与 Raspberry Pi 基金会合作,面向11-14岁的学生传授基本的人工智能知识,课程名为「 Experience AI 」,课程从最基础的AI概念讲起,并通过用模型做分类的实际例子来加深对于概念和原理的理解。而微软推出的课程名为「 Generative AI for Beginners 」,一步步介绍生成式AI、提示词工程,以及生成式AI的各种应用,比如聊天、搜索、图片生成、低代码应用等等。
Adobe和斯坦福大学团队等发布新的 3D 生成方法“DMV3D”,单个 A100 生成 3D 图像只需 30 秒
来自 Adobe 研究院和斯坦福大学等机构的研究者利用基于 transformer 的 3D 大型重建模型来对多视图扩散进行去噪,并提出了一种新颖的 3D 生成方法 DMV3D,能直接根据模型文字或单张图片的输入,生成 3D NeRF。在单个 A100 GPU 上,仅需 30 秒,DMV3D 就能生成各种高保真 3D 图像。
2023年11月26日·周日
魅族 FlymeAR 系统采用全新 Aicy 语音助手,支持自定义角色聊天
星纪魅族 XR 微博发文宣布,FlymeAR 系统将采用全新的 Aicy 语音助手,宣称“将为你带来天马行空的创意创作、自定义角色聊天、聪明的攻略制定,Aicy 全能问答,无所不知。”从宣传语上看,Aicy 或许将接入大模型,魅族 AR 眼镜有望首批搭载。
李沐大模型公司细节曝光,项目GitHub空仓标星超500
被曝从亚马逊首席科学家的职务上离职后,李沐联手其导师、另一位亚马逊出身AI大牛Alex Smola的创业公司Boson.ai既没有高调露面,也没有什么隐秘爆料跟上。近日,李沐大模型创业方向,终于“水落石出”:利用大模型能力,做游戏引擎,且是面向4A游戏。
O’Reilly 发布 2023 年生成式人工智能企业报告,显示三分之二的企业已在采用
GenAI 技术 O’Reilly 近日发布了一项针对企业中生成式 AI 现状对 2800 多名技术专业人士进行的全球调查结果, 《Generative AI in the Enterprise》 报告探讨了企业如何使用生成式人工智能,调查显示 GenAI 的采用速度比近年来任何其他技术都要快,三分之二 (67%) 的公司目前正在使用 GenAI,超过三分之一 (38%) 的公司使用人工智能的时间还不到一年。
2023年11月25日·周六
苏黎世联邦理工学院研究团队推出 UltraFastBERT,可使语言模型加速 78 倍
在一篇新论文《Exponentially Faster Language Modelling》中,苏黎世联邦理工学院的研究团队介绍了 UltraFastBERT,这是 BERT 架构的一种变体。UltraFastBERT 采用了革命性的方法,用快速前馈网络替换前馈层,与优化的基线前馈实现相比,速度提高了 78 倍。
普京:不能让西方垄断AI领域,俄罗斯必须提升自身水平
俄罗斯总统普京表示,不能让西方在人工智能(AI)领域形成垄断,俄罗斯将很快批准一项新的AI发展战略。普京表示,新AI战略将做出重大改变,包括扩大生成式AI和大型语言模型领域的基础和应用研究。
意大利人工智能初创公司 Aptus.AI 获 300 万欧元 A 轮融资
意大利机器可读文档初创公司 Aptus.AI 宣布获得 300 万欧元的 A 轮融资,该公司开发了专有的人工智能技术——Daitomic,一个实时更新的 RegTech(监管科技) SaaS 平台,可以生成法律文件的机器可读版本,使所有相关的国家和欧洲法规易于访问和查阅。
德国AI放射诊断解决方案初创公司 Floy 获 540 万欧元种子轮融资
总部位于慕尼黑的人工智能公司 Floy 已成功完成一轮 540 万欧元的种子融资,用于推进放射学领域的人工智能技术,帮助医生做出更精确的诊断。筹集的资金将用于新人工智能产品的开发,巩固该公司在德国市场领导者的地位,并推动其在欧盟和美国的扩张。
2023年11月24日·周五
消息称中国特供版英伟达 H20 AI 芯片推迟到明年一季度发布
芯片咨询公司 SemiAnalysis 此前消息称,英伟达现已开发出针对中国区的最新改良版 AI 芯片,包括 HGX H20、L20 PCIe 和 L2 PCIe,在 LLM 推理中,要比 H100 快 20% 以上。据路透社报道,两位消息人士透露,英伟达已告知中国客户,HGX H20 AI 芯片的推出时间将推迟到明年第一季度。
视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效
视频生成领域最新的研究成果 PixelDance 的视频生成结果的动态性显著优于目前现有的其它模型,引起了业界的关注。用户只需要提供指导图片+文本描述,PixelDance 就可以生成有高度一致性且有丰富动态性的视频,其中指导图片可以是真实图片,也可以利用现有的文生图模型生成。
新研究:ChatGPT可伪造看似合理“支持”科学假说的试验数据
一项日前发表在《美国医学会杂志·眼科学卷》杂志上的新研究说,ChatGPT背后的技术可以伪造“看似真实”的试验数据,看上去能“支持”未经验证的科学假说。据英国《自然》杂志网站近日报道,意大利卡坦扎罗大学等机构研究人员先要求GPT-4 ADA创建一个关于圆锥角膜患者的数据集。随后,研究人员要求GPT-4 ADA编造临床数据,以支持深板层角膜移植术比穿透性角膜移植术效果更好的结论。
知乎最新版 APP 上线“智能标题”功能
记者从知乎了解到,“知海图AI”大模型正加速落地应用。近日知乎在最新版App中上线了“智能标题”功能,用户在“想法”编辑过程中可借助AI能力快速生成标题,辅助创作。
联发科董事长蔡明介:AI手机渗透率会呈直线上升趋势
联发科董事长蔡明介表示,去年底生成式AI火热,紧接着边缘运算AI将接棒在各行各业展开,联发科在各领域布局。他指出,生成式AI手机将是下波杀手级应用,看好手机市场明年重回成长轨迹。蔡明介还表示,AI手机渗透率会呈直线上升趋势。
2023年11月23日·周四
Altman回归后,OpenAI的员工股票出售计划也重回正轨
据报道,在Sam Altman回归OpenAI重新担任CEO后,该公司的员工股票出售计划也重回正轨,为公司估值约860亿美元。这笔交易由Thrive Capital牵头,将从员工和其他投资者手中购买高达10亿美元或更多的股票,预计将于下个月完成。
比尔·盖茨:AI将使每周工作三天成为可能
微软联合创始人、前世界首富比尔·盖茨(Bill Gates)认为,AI(人工智能)可能无法取代人类,但它可以让每周工作3天成为可能。盖茨在一档播客节目中说道:“如果你最终进入一个每周只需要工作三天的社会,那可能还不错。”他认为,未来可能“机器可以制造所有的食物和东西”,人们不必每周工作五天来维持生计,剩余的时间可以去用有益的事情,“有很多闲暇时间,得想想如何利用。”
Inflection 发布「Inflection-2」,称是当今世界第二强的大模型
由谷歌DeepMind 联合创始人创立的 Inflection AI 公司宣布已经完成了 Inflection-2 的训练,称其是世界上计算能力中最好的模型,也是当今世界上能力第二强的大模型。新模型 Inflection-2 相比几个月前发布的 Inflection-1 的能力要强得多,包括事实知识的显着改进、更好的文体控制以及推理能力,在多个 AI 性能基准测试中都表现出色。
消息称 Altman 被罢免的原因是内部一项名为“Q*”的AI技术突破可能威胁人类
据媒体援引知情人士的话报道,在奥特曼被罢免之前,几名公司研究人员向董事会发出了一封信,警告称一项强大的人工智能(AI)发现可能威胁人类。消息人士表示,这封此前未被报道的信件和AI算法,是导致OpenAI董事会罢免奥特曼的催化剂。他们称,董事会对奥特曼的诸多不满导致后者被解雇,而这封信是原因之一。据其中一位消息人士透露,长期担任OpenAI高管的米拉·穆拉蒂周三告诉员工,一封关于名为Q*(发音为Q-Star)的AI突破的信件促使董事会采取了行动。
谷歌 Chrome 浏览器设置新增 AI 专栏:可组织标签页、撰写文本等
根据浏览器爆料者 @Leopeva64 分享的最新推文,谷歌 Chrome 浏览器即将引入一系列 AI 功能 / 特性,帮助用户管理标签页、撰写文章等等。报道称在 Canary 频道最新 Chrome 浏览器中,在设置页面新增了名为“高级”(Advanced)的页面,用户可以通过“chrome://settings/ ai”路径直接访问这两项设置。
谷歌更新 Bard AI 助手,可以理解 YouTube 视频并提供相关见解
根据谷歌官方更新的 Bard 日志,该 AI 聊天机器人新增技能,可以观看和理解 YouTube 视频,并为用户提供视频相关的见解。谷歌称:“我们希望帮助用户更深入地互动和了解 YouTube 视频,因此,我们正在扩展 YouTube 扩展程序,以便您可以与 Bard 进行更丰富的对话。”
Adobe 收购 AI 文本到视频生成平台 Rephrase
软件巨头 Adobe 发布了一份内部备忘录,宣布收购总部位于加州的文本到视频生成公司Rephrase。虽然这笔交易的成本尚未披露,但此举预计将增强 Adobe 的 Creative Cloud 产品矩阵,这些产品在过去一年中已逐渐进行了新一代 AI 升级。特别是,Rephrase 将帮助该公司赋予客户仅用文本生成专业级视频的能力。来源: VentureBeat
微软最新 Windows 10 系统预览版推出,开始测试 Copilot 助手
微软上周宣布 Copilot 将引入到 Windows 10,现在该操作系统的发布预览版可供使用并与 Copilot 一起进行测试。处于发布预览通道的 Windows 10 家庭版或专业版用户现在就可以尝试以前仅在 Windows 11 中提供的 Copilot 功能。
2023年11月22日·周三
小米澎湃 OS 宣布小爱同学大模型上线“文章摘要”功能
小米澎湃 OS 今日宣布,小爱同学大模型现已上线“文章摘要”功能。据介绍,该功能具有系统级入口,支持多类应用,节省用户的阅读时间;英文文章,直接生成中文摘要,阅读更迅速。对小爱同学说“总结这篇文章”即可触发功能。
字节旗下办公平台飞书发布「飞书智能伙伴」,接入大模型能力
在今天下午举行的 2023 秋季飞书未来无限大会上,飞书智能伙伴正式发布,限时开放 10000 个名额,用户可 预约试用 。据悉,“飞书智能伙伴”作为一个开放的 AI 服务框架,企业可根据业务场景自主选择适合的底层大模型,支持内容总结、内容创作、数据分析、系统搭建等业务场景。
百度入选《财富》杂志全球人工智能创新者50强榜单
昨天,《财富》发布了其首届全球“《财富》人工智能创新者50强榜单”( Fortune 50 AI Innovators ),百度成为唯一入选该榜单的中国企业。同时入选50强的还有微软、谷歌、OpenAI、Anthropic、谷歌DeepMind、Meta和英伟达等知名科技企业。评语中指出,百度文心大模型4.0在成熟度和功能上与OpenAI的ChatGPT不相上下,并在多项中文特定任务中超越了ChatGPT。
微软将在12月1日面向中国企业和教育用户开放 Copilot
据微软发布的消息,微软将在 2023 年 12 月 1 日面向中国大陆的企业和教育机构推出 Web AI 聊天功能 Copilot ,即此前的 Bing Chat Enterprise。企业和教育机构可以使用 Windows Copilot、Bing Chat Enterprise 以及在 Microsoft Edge 中使用 Copilot,AI 模型是支持联网获取数据的。
微软开源 Windows Terminal Canary AI 聊天机器人功能,用户可导入自家模型
微软在此前 Build 2023 开发者大会上,宣布为 Windows Terminal 应用添加 AI 聊天机器人功能,可以“向用户推荐命令、解释错误,并帮助用户采取后续操作”。而日前微软宣布将开放 Windows Terminal 的 AI 聊天能力,引入了“Terminal Chat”功能,微软宣称这项功能是“开源的”,并希望能够让开源社区帮助定义这款应用中的 AI 能力,同时邀请开发人员尝试体验并参与构建过程。
英伟达宣布与罗氏制药旗下的 Genentech 合作开发 AI 平台
英伟达宣布与罗氏制药旗下的Genentech合作,将开展一项AI平台研究,以加速药物发现和开发。两者将在NVIDIA DGX Cloud上构建AI模型。Genentech还计划使用NVIDIA BioNeMo(一个用于药物研发的生成式AI 平台),让生物技术公司能够大规模定制模型,并将BioNeMo云应用程序编程接口直接集成到计算药物发现工作流程中。
Sam Altman 复职 CEO 后,Greg Brockman 亦重返 OpenAI
微软CEO纳德拉表示,为OpenAI董事会的变动感到鼓舞,它是增强OpenAI治理稳定性的至关重要的第一步。OpenAI创始人Sam Altman表示,期待回到OpenAI,并与微软建立牢固的合作伙伴关系。OpenAI联合创始人兼前总裁Greg Brockman回应声明称,今天取得了惊人的进展,我们将比以往任何时候都更强大和团结,重返OpenAI并将于今晚开始编码。
OpenAI:Altman 将重返公司任CEO,美国前财长加入新董事会
OpenAI在社交平台X上宣布,已经原则上达成协议,Sam Altman 重返公司担任CEO。新的董事会名单显示,只保留了Quora的首席执行官亚当·德安吉洛(Adam D’Angelo),Salesforce前联合首席执行官布雷特·泰勒(Bret Taylor)和前美国财政部长萨默斯(Larry Summers)加入新成立的董事会。OpenAI联合创始人兼前总裁Greg Brockman回应声明称,“今天取得了惊人的进展,我们将比以往任何时候都更强大和团结。”
美国多位作家起诉 OpenAI 和微软,指控其滥用版权作品来训练模型
多位作家在美国曼哈顿联邦法院对微软和OpenAI提出集体诉讼,指控这两家公司滥用作家作品来训练人工智能模型,从而支持其ChatGPT等AI服务并从中牟利。参与本次集体诉讼的除了美国知名小说家约翰·格里沙姆(John Grisham)、乔纳森·弗兰岑(Jonathan Franzen)等人以外,还有一位国人非常熟悉的小说家——美剧《权力的游戏》原著(《冰与火之歌》)作者乔治·马丁(George R.R. Martin)。
「小智未来」完成近500万天使轮融资,专注打造AI知识付费课程
“小智未来”近日完成近500万天使轮融资,由逆熵创投参投。本轮融资资金主要用于拓展产品市场,扩大研发团队规模以及课程研发等。小智未来成立于2023年,主要是开发一系列人工智能相关的付费课程,为各年级学生、社会人士和企业提供人工智能培训和咨询服务。
拼多多正成立大模型团队,并以百万年薪招聘相关职位
据Tech星球报道,拼多多已经成立了一个数十人的大模型团队,团队位于上海。大模型团队将探索大模型在拼多多客服、对话等场景下的应用,且会拓展至其旗下跨境电商平台TEMU智能客服、搜索、推荐等业务场景。目前,整个进程仍处于研发阶段。Tech星球发现,拼多多已经通过官网,以及其他招聘渠道,开始在大模型领域招兵买马,有关大模型职位的年薪百万不在少数,最高将近130万元。
X Premium+ 订阅用户新权益,X(推特)已邀请其尝鲜 Grok AI 体验
消息源 @nima_owji 透露,X(推特)目前已经邀请部分用户,在其 X 应用中体验全新的 Grok AI 聊天体验。如果受邀用户并未购买 Premium + 订阅,会跳出“Get Grok with Premium+”的提示,推荐用户购买 Premium + 订阅,价格为每月 16 美元。
OpenAI 开放 ChatGPT Voice 语音聊天体验,前公司总裁邀请用户尝试 OpenAI
今天面向所有用户免费开放 ChatGPT Voice 语言聊天功能,已经离职的 Greg Brockman 在 X 平台跟帖表示:“ChatGPT Voice 面向所有免费用户推出。尝试一下 — 彻底改变 ChatGPT 体验”。
Stability AI 推出 AI 视频生成模型 Stable Video Diffusion
Stability AI 推出了其最新的生成式人工智能产品——Stable Video Diffusion,该公司表示,这代表着从文本提示合成逼真视频方面的重大飞跃。该视频生成模型目前处于初始研究预览版本,建立在 Stability AI 广泛使用的 Stable Diffusion 图像创建系统的功能之上。
OpenAI 产品副总裁呼吁员工回公司上班
OpenAI产品副总裁Peter Deng周二在致员工的信中称,是时候“重新启航”了。此举是为了让公司专注于软件开发和建立合作伙伴关系,而不是围绕上周五被董事会解雇的奥特曼是否会重返首席执行官一职而上演的“他会不会回来”的大剧。Deng在信中表示,“引导我们精力的最佳方式”是开发人工智能产品。此外知情人士表示,董事会和奥特曼希望在感恩节假期前达成解决方案。
OpenAI 董事会据称正与 Sam Altman 就回归进行谈判
据媒体报道,OpenAI联合创始人、前CEO山姆·奥特曼和该公司董事会成员已开始谈判,双方在探讨奥特曼重返OpenAI的可能性。一位知情人士表示,目前正在讨论的一种情况是,奥特曼将以过渡董事会的董事身份回归OpenAI。
Anthropic 推出 Claude 2.1 版本模型,支持 200K上下文并减少幻觉
人工智能初创公司 Anthropic 推出了其最新的对话模型 Claude 2.1,宣传旨在改进企业应用程序的新功能。该版本将 Claude 的上下文长度限制增加了一倍,达到 200,000 个token,并将错误陈述率降低了 50%。
2023年11月21日·周二
用AI技术合成造谣视频牟利,浙江首例团伙制作假视频案宣判
利用AI技术合成造谣视频20余条,并发至多个热门视频平台上牟利。浙江绍兴市上虞区法院日前宣判一起团伙利用AI技术合成虚假视频以牟取非法利益的编造、故意传播虚假信息案。法院依法判处被告人张某某、陈某某被判处有期徒刑一年一个月,缓刑一年六个月。
消息称 Altman 仍愿意重回 OpenAI 当 CEO,前提是董事会下台
Sam Altman 在遭到 OpenAI 解雇后,于昨日出人意料地转投微软,但这并不是板上钉钉的事。多位消息人士告诉 The Verge,如果解雇他的其余董事会成员下台,他和联合创始人 Greg Brockman 仍然愿意重返 OpenAI。
广东:支持广州、深圳推进国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设
日前,广东省人民政府办公厅发布关于印发“数字湾区”建设三年行动方案的通知。其中提出,鼓励“开放广东”、香港“资料一线通”等平台协同共享,免费向社会开放更多公共数据。支持广州、深圳推进国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设,打造人工智能技术创新策源地。
英国政府计划组建一支 AI 特别工作组以精简公务员队伍
据当地媒体报道,英国副首相奥利弗·道登(Oliver Dowden)计划组建一支由30名“高端、技术能力强”的人工智能和数据工程专家组成的特别工作组,每年预算约为500万英镑,以启动公共服务转型进程。该 AI 工作组的职责是缩小英国公务员队伍的规模,并提高公共部门的生产力。
人工智能公司 C3.ai 被曝大范围减员,股价遇断崖式下跌
有媒体爆出,人工智能软件公司C3.ai上周实施了减员,波及多个部门。公司给出的理由是,员工绩效表现不佳、并且公司需要节省成本。这一消息一经公开,该公司股价出现断崖式下滑,股价跌破30美元。
一加上线 AI 音乐工作室,用户可自由创作音乐、视频
一加手机在海外官网上线了 AI 音乐工作室(AI Music Studio),用户可以创作和分享 AI 生成的音乐。据了解,一加围绕 AI 音乐工作室开展了一项比赛,从每个地区的热门歌曲艺术家中选拔参赛作品。
OpenAI 正在积极讨论“重新团聚”公司事宜
据 OpenAI 全球事务副总裁 Anna Makanju 周一在给员工的备忘录中显示,OpenAI 正在进行积极讨论,以 “重新团聚” 公司。OpenAI 员工正与创始人Sam Altman“保持联系”,与CEO、董事会“进行接触”。OpenAI 表示,我们的头号目标是 OpenAI 重新团结。
JetBrains 发布 2023 开发者报告:77% 开发者使用 ChatGPT 聊天助手
JetBrains 日前公布了 《2023 开发人员生态系统现状》 调研报告,汇集了来自全球 26,348 位开发者的调研结果。其中关于生成式AI服务的调查结果显示,77% 的开发者使用 ChatGPT 聊天助手,46% 的开发者使用 GitHub Copilot 编程助手。开发者使用 AI 助手的最常见方式是使用自然语言询问软件开发相关一般问题。但 59% 的开发者对使用生成式 AI 服务有安全顾虑。
金山办公回应隐私政策:用户文档从未被用于AI训练
近日,《WPS隐私政策》中关于美化功能及其对用户文档处理方式的描述引发关注。11月21日,记者从金山办公方面得到回应,用户文档从未被用于AI训练。公司已更新了《WPS隐私政策》,去除了容易引起误解的表述,并确保其内容与实际操作严格对应。
OpenAI 董事会曾联系竞争对手 Anthropic 讨论合并
据媒体援引知情人士说法称,在开除掉Sam Altman之后,OpenAI董事会曾与其主要竞争对手、明星AI初创公司Anthropic联合创始人兼CEO Dario Amodei探讨两家公司合并事宜。知情人士表示,OpenAI董事会试图说服Dario Amodei接任OpenAI CEO的位置,所以谈到了合并的事情。不过,该知情人士并未透露合并提议是否有“严肃的讨论”。据悉,Amodei很快就拒绝了OpenAI董事会让他来接替Sam Altman的提议。
奥特曼仍可能重返OpenAI,微软CEO表态:对此持开放态度
微软首席执行官萨蒂亚·纳德拉日前表示,他对山姆·奥特曼重返OpenAI持开放态度;纳德拉表示,无论奥特曼是加入微软还是回到OpenAI,这位企业家都将与微软合作;他还表示,无论怎样,OpenAI都需要改革治理方式。
OpenAI 超过100 名客户联系竞争对手 Anthropic
据有关媒体报道,关于OpenAI 前首席执行官Sam Altman被解雇的事件持续发酵,外界对于 OpenAI 未来的质疑不断上升。与此同时,OpenAI 的客户正在寻找退出的机会,这表明该公司可能会有大量业务流失,从而令这家初创公司遭受重创。据悉周末有超过 100 名 OpenAI 客户联系了 OpenAI 的竞争对手 Anthropic。知情人士称,还有人联系了谷歌 Cloud 和 OpenAI 的另一家竞争对手初创公司 Cohere。
OpenAI 曾试图邀请原 GitHub CEO 和 Scale AI 创始人担任临时 CEO 的职位
据知情人士透露,在前 Twitch 首席执行官 Emmett Shear 接受 OpenAI 临时首席执行官职位之前,董事会曾邀请 Nat Friedman(微软旗下 GitHub 的前首席执行官、人工智能初创公司的多产投资者)以及 Scale AI 联合创始人兼首席执行官 Alex Wang 担任该职位。知情人士称,两人都拒绝了这一提议。
2023年11月20日·周一
OpenAI 近 500 名员工签署集体辞职联名信要求恢复 Sam Altman 和 Greg Brockman 职务
据外媒Wired报道,当地时间周一,500 多名OpenAI员工签署了一封公开信,以集体辞职威胁OpenAI董事会退出,并恢复Sam Altman的首席执行官职务,以及联合创始人Greg Brockman的总裁职务。有趣的是,联名信的签署人中,也包括了 Ilya Sutskever 的名字。
亚马逊推出“AI Ready”计划:到 2025 年为全球 200 万人提供免费 AI 技能培训
亚马逊于当地时间周日宣布正式推出“AI Ready”计划,这项计划承诺到 2025 年为全球 200 万人提供免费的 AI 技能培训。亚马逊表示,AI 是本世代最具变革性的技术,若要充分释放其潜力,以解决世界上最具挑战性的问题,就必须让任何有学习愿望的人都能接受 AI 教育。为实现目标,亚马逊将推出针对成人和青少年学习者的一系列新举措,并扩大现有免费 AI 培训计划,以从成本上消除学习者获取这些技能的障碍。
vivo 千询 AI 助手开放下载,各大品牌手机均可使用
在今年的 vivo 开发者大会上,vivo 发布了“蓝心千询”自然语言对话机器人,基于蓝心大模型,并开放给其他手机品牌使用。目前,这款“vivo 千询”应用已经上架官方应用商店,可随意下载 Apk 文件安装使用。
微软 CEO 纳德拉宣布:Sam Altman 和 Greg Brockman 将加入微软
微软首席执行官纳德拉在 X 平台上宣布,OpenAI创始人山姆·奥特曼(Sam Altman)和格雷格·布罗克曼(Greg Brockman)将加入微软。纳德拉表示,奥特曼和布罗克曼及其同事将加入微软,领导一个新的高级 AI 研究团队。纳德拉还在推文中证实了,埃米特·谢尔(Emmett Shear)将担任OpenAI CEO,“我们期待了解埃米特·谢尔和OAI的新领导团队并与他们合作。”
消息称 Sam Altman 回归 OpenAI 失败,董事会已任命 Emmett Shear 为临时 CEO
据 The Information 和福布斯的最新消息,OpenAI 董事会已选择前 Twitch 首席执行官 Emmett Shear 担任临时首席执行官,萨姆・阿尔特曼(Sam Altman)回归失败。报道称,当地时间周日晚上,OpenAI 联合创始人兼董事会董事 Ilya Sutskever 告诉员工,尽管公司高管努力让阿尔特曼重新担任 OpenAI 首席执行官,但没有成功。
马斯克:研发先进AI风险非常高,OpneAI应公布解雇奥特曼的原因
特斯拉首席执行官埃隆·马斯克(Elon Musk)表示,由于研发先进人工智能(AI)技术的潜在危险非常高,作为目前世界上最强大的人工智能公司,OpenAI应该解释其解雇其首席执行官萨姆·奥特曼(Sam Altman)的原因。
若 Altman 重返岗位,微软将寻求获得 OpenAI 董事会席位
据 The Information 报道,两位知情人士透露,OpenAI 最大的支持者微软正在考虑,如果被罢免的首席执行官萨姆·奥特曼(Sam Altman)重返 OpenAI,微软将在董事会中担任一职。其中一位知情人士表示,微软要么可以在 OpenAI 董事会中占有一席之地,要么作为没有投票权的董事会观察员。
德法意三国达成AI监管协议,反对过度限制技术发展
据外媒援引一份联合文件称,法国、德国和意大利已就如何监管人工智能达成协议。该协议承诺,仅会监管人工智能的应用而非这门技术本身,同时,会在查明AI应用出现不当行为之后才对其进行制裁。外媒预计,德法意达成的这份协议将加速欧洲层面的谈判,并为欧洲层面的AI监管准则提供蓝本。
2023年11月19日·周日
马斯克:X 公司投资者将拥有旗下人工智能公司 X-AI 四分之一股份
Tesla 和 xAI CEO 马斯克通过 X 平台发帖宣布,X 公司的投资者将拥有旗下人工智能公司 xAI 的 25% 股份。马斯克的 xAI 于北京时间 7 月 13 日成立,按照他的说法,推出 xAI 的原因是想要“了解宇宙的真实本质”。
OpenAI 的投资者正在向董事会施压,要求 Sam Altman 重返公司
彭博援引知情人士报道称,OpenAI的投资者正在向OpenAI董事会施压,要求撤销罢免这一决定。上述知情人士还称,微软CEO Satya Nadella一直与阿尔特曼保持联系,并承诺无论阿尔特曼下一步采取什么措施,都会支持他。
隐私政策引发争议,WPS深夜致歉:“所有用户文档不会用于AI训练”
近期,《WPS隐私政策》中关于美化功能及其对用户文档处理方式的描述引发关注。11月18日深夜,WPS官方微博做出回应,在向用户致歉的同时,承诺用户文档不会被用于AI训练目的。
2023年11月18日·周六
金沙江创投朱啸虎:200多个大模型或收敛到10-20个
朱啸虎认为,200多个大模型很快会进入收敛期,明年这个时候可能只剩下10-20个大模型,因为大部分大模型现在很难差异化和商业化。没有商业化落地的AIGC(生成式人工智能)都是讲故事,投资人很难有兴趣。
微软面向 Canary 频道 Windows Terminal 用户开放 AI 聊天体验
微软宣布面向开源社区,开放 Windows Terminal AI 体验。开发人员可以免费试用 AI 提供的诸多新功能,并可以向微软提交反馈以改善该体验。微软目前已经在 Canary 频道的 Windows Terminal 中,推出了 Terminal Chat 功能,让用户通过和 AI 的聊天,帮助查找命令或解释错误等任务。该 AI 服务不附带自己的大型语言模型,因此用户需要提供自己的大型语言模型。
OpenAI 突然罢免 CEO 奥特曼,董事会称对其领导能力失去信心
当地时间周五,人工智能公司OpenAI宣布,萨姆·奥特曼(Sam Altman)将辞去首席执行官一职,并退出董事会,首席技术官Mira Murati被任命为临时首席执行官。奥特曼的突然离职在整个科技行业引发了轩然大波,这一消息也让OpenAI许多员工措手不及,他们也是从公司公告中得知管理层的突然洗牌。
OpenAI CEO 表示仅靠扩展大语言模型不太可能实现 AGI
OpenAI 首席执行官 Sam Altman 近日在剑桥大学 2023 年霍金奖学金发表演讲时表示,仅靠大型语言模型不太可能足以创建通用人工智能 (AI),需要进一步突破。Altman 还强调了人工智能安全的重要性,以及通过使用测试、外部专家、安全监控系统和最佳实践来确保人工智能与人类价值观保持一致的必要性,以确保安全。
亚马逊计划在 Alexa 部门裁员数百人,将更专注于生成式人工智能
亚马逊将裁减 Alexa 语音助手业务部门数百个岗位,理由是业务重点发生了变化,将把更多资源投入到生成式人工智能领域。亚马逊还计划中止一些项目,但没有具体说明裁员的确切规模或计划中止哪些项目。来源: 财联社
Discord 将于 12 月 1 日起停用人工智能聊天机器人 Clyde
Discord 正在关闭其实验性人工智能聊天机器人 Clyde,该聊天机器人将在本月底停用,到 12 月 1 日,“用户将无法再在 DM、群组 DM 或服务器聊天中调用 Clyde。” Discord 在今年早些时候开始测试 Clyde 的人工智能功能,使用 OpenAI 的模型让聊天机器人回答问题并与 Discord 用户进行对话。
2023年11月17日·周五
智源研究院发布 11 月 FlagEval 大模型评测榜单
智源研究院发布 FlagEval 大语言模型评测榜单11月榜,开源了中文语义理解评测基准C-SEM,新增近期模型评测:ChatGLM3-6B、ChatGLM2-12B(闭源)、Yi-34B、Skywork-12B、LingoWhale-8B,这也是FlagEval平台首次发布闭源模型评测结果。
OpenAI CEO:AI 将阻止人类自我毁灭,短期内不需严格监管
在美国旧金山举行的亚太经合组织峰会(APEC)上,多位科技企业领袖齐聚一堂,讨论今年大热的人工智能领域的前景。在会上,人工智能公司 OpenAI 的首席执行官 Sam Altman 表达了对人工智能技术的看好,称人工智能或将阻止人类自我毁灭,并认为,这一技术短期内还不需要重大监管。
ChatGPT被曝测试新功能:学习所有历史聊天,还能重置记忆
多位 X 平台的用户表示,ChatGPT可能要上新一项重大功能了,那就是记住你之前的聊天内容并不断从中学习(并非单纯保存历史记录),从而了解你的偏好和信息,用于在日后聊天派上用场。从网友曝出的截图来看,这个新功能将在“设置”中直接成为一个新的Tab,名字叫“My ChatGPT”。该功能需要手动开启,点击其中的“Learn from your chats”选项之后,ChatGPT就可以开始学习你的聊天内容了。
微软 CEO 纳德拉:AI 工具将降低软件开发准入门槛,行业对熟练程序员仍有需求
微软公司 CEO 萨蒂亚・纳德拉日前接受《麻省理工科技评论》专访,分享他对人工智能和开发者平台转变的看法。纳德拉表示,开发者平台当前正在发生转变,其重要性可类比从大型机到台式机,或从台式机到移动设备。同时,他还认为 AI 工具将降低软件开发的准入门槛,并提高现有开发人员的工作效率,最终将引领创造力的新时代。
日本 Rapidus 将与加拿大 AI 芯片公司 Tenstorrent 合作开发2纳米芯片技术
日本半导体制造商 Rapidus 宣布将与加拿大AI芯片初创公司 Tenstorrent 合作开发2纳米逻辑芯片技术,以帮助设备接入人工智能。Tenstorrent 由“芯片大师”吉姆·凯勒(Jim Keller)创立,从事高性能 RISC-V CPU 的设计。
剑桥词典公布 2023 年度词汇:Hallucinate(产生幻觉)
剑桥词典公布2023年度词语为“Hallucinate”,这个词的原本定义为“似乎看到、听到、感觉到或闻到一些不存在的东西,通常是因为健康状况或因为你服用了某种药物而产生幻觉”,但在AI大时代下,“Hallucinate”多了一个额外含义,新增注解为“当AI产生幻觉,它会生成错误信息”。剑桥词典网站解释道,之所以选择“Hallucinate”为年度代表词,是因为新含义“触及了人们正在谈论的AI核心”。
ChatGPT 网页版现重大 Bug,修改网址即可一键切换 GPT-3.5 为 4.0
据 X 平台多名用户反馈,ChatGPT 网页版日前出现了重大漏洞,只需修改网址即可一键令 GPT-3.5 版本“升级”为 4.0。据悉,用户只需进入 ChatGPT 官网聊天页,在网址后加上“/?model=gpt-4-gizmo”,即可使用 GPT-4.0,显然是鉴权系统上出现了严重“临时工”级 Bug。
调查:超八成受访全国高校大学生曾使用AI工具
近日,中国青年报·中青校媒面向全国高校学生发起关于AI工具使用的问卷调查,共回收有效问卷7055份。调查结果显示,84.88%受访者曾使用过AI工具,其中16.30%受访者经常使用AI工具,57.49%受访者偶尔使用,19.43%受访者基本不用。
红杉合伙人:人工智能会让世界多出十亿开发者,可与AGI的价值相媲美
知名风投机构红杉合伙人 David Cahn 近日发文称,相信开发人员数量将持续高速增长,人工智能将催生10亿开发者,而这10亿开发人员引入软件行业可以在经济影响方面与 AGI 相媲美。如果我们能够在人工智能的帮助和加速下使软件工程更广泛地使用,它可能会助力许多非技术行业的自动化,创造经济盈余。
荣耀将推出自研70亿参数端侧AI大模型和全新云服务
荣耀CEO赵明发布了新荣耀成立三周年讲话,其中提到,荣耀目前在海外市场增速超过200%,并在两年内实现了盈利性增长。此外,荣耀即将推出自研70亿参数端侧AI大模型和全新云服务。
百川智能与鹏城实验室开展合作,推出128K长窗口大模型
百川智能与鹏城实验室宣布携手探索大模型训练和应用,合作研发基于国产算力的128K长窗口大模型“鹏城-百川·脑海33B”。“鹏城-百川·脑海33B”的128K长上下文窗口基于“鹏城云脑”国产算力平台训练,未来可升级至192K,是基于国产算力训练的最长上下文窗口。
腾讯云发布大语言模型推理加速引擎「TACO-LLM」
TACO-LLM 是基于腾讯云异构计算产品推出的一款大语言模型推理加速引擎,用于提高语言模型的推理效能。通过充分利用计算资源的并行计算能力,TACO-LLM能够同时处理更多的语言模型推理请求,已成功为客户提供了兼顾高吞吐和低时延的优化方案,吞吐性能提高了78%。
微软确认将把 Copilot 聊天机器人引入 Windows 10
微软日前表示,它将很快开始在广泛使用的 Windows 10 操作系统的更新中测试 Copilot 聊天机器人,计划将在预览通道中向运行 Windows 10 版本 22H2 的 PC 提供 Copilot,且仅适用于家庭版和专业版的 Win10 操作系统。
Meta 推出基于人工智能的视频编辑工具
Meta推出了两项基于人工智能的视频编辑新功能,可用于在 Instagram 或 Facebook 上发布视频。第一个功能名为“Emu Video”,可以根据纯文本、纯图像或组合的文本和图像输入来生成视频。另一款名为“Emu Edit”,用户可以通过文本指令进行自由形式的编辑。
谷歌CEO:中国将走在人工智能的前沿,中美应合作监管创新
Alphabet Inc.(谷歌母公司)首席执行官桑达尔·皮查伊表示,他预计中国将走在人工智能的“前沿”,并表示美国需要尽快在监管和创新方面与中国合作;谷歌人工智能部门DeepMind的高管在近期也曾强调,在未来一段时间内,中国在人工智能领域仍将落后于美国。
谷歌将推迟发布 Gemini AI,预计明年一季度推出
据 The Information 报道,两位知情人士透露,谷歌将推迟发布其 OpenAI 的竞品 Gemini AI。知情人士称,Gemini 要等到明年第一季度才能使用。今年早些时候,谷歌代表告诉一些云客户和业务合作伙伴,他们将在 11 月之前推出该公司新的对话式人工智能 — 大型语言模型 Gemini。
Unity 上线游戏生成AI平台 Muse 测试版,定价30美元每月
Unity 宣布 Muse AI 平台正式上线公开测试的早期访问版本,付费版每月费用为 30 美元。Muse 最初于 7 月推出,是一套人工智能驱动的工具,允许用户通过与聊天机器人交互来获取可用的游戏代码,旨在简化游戏开发过程。
谷歌 Deepmind 和 YouTube 推出用于音乐生成的 Lyria AI 模型
谷歌 Deepmind 与 YouTube 合作推出了两项音乐 AI 实验:Dream Track(一项针对 YouTube Shorts 短视频的实验)和 Music AI Tools(一套为艺术家、词曲作者和制作人提供的工具)。作为 Dream Track 项目的一部分,Google Deepmind 正在与 YouTube 一起测试 Lyria —— 一种用于音乐生成的人工智能模型,旨在增强音乐家和艺术家的创作过程。
Stability AI 的音频团队主管从该公司辞职,质疑对内容训练的版权合理性
Stability AI 的音频团队的主管 Ed Newton-Rex 宣布从 Stability AI 辞职,对该公司关于在人工智能训练中使用受版权保护的内容属于“合理使用”的说法提出质疑。
2023年11月16日·周四
数字政通发布政务大模型“人和大模型”,助力政府客户数字治理体系建设
今日,智慧城市供应商数字政通官宣政务大模型“人和大模型”,该大模型能解决民生诉求、法治政府、城市管理等多种城市治理问题。在百模大战愈演愈烈之际,基于通用大模型进行垂直开发,深耕政务、金融、医疗等细分领域已是大势所趋。
谷歌发布 30 亿参数模型 Mirasol,将多模态理解扩展到长视频
谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。借助 Mirasol AI 模型,该团队试图解决两个关键挑战:1.需要以高频采样同步视频和音频,但要异步处理标题和视频描述。2.视频和音频会生成大量数据,这会让模型的容量紧张。
Moonshot AI 旗下 Kimi Chat 面向全社会开放服务
大模型初创公司 Moonshot AI 今日发文称,即日起, Kimi Chat 将面向全社会开放服务。另外,Moonshot 模型版本更新至 moonshot-v1-20231115,大幅解决模型在复杂场景下输出重复的问题。
5分钟速览微软 Ignite 技术大会揭幕演讲:AI软硬件版图集大成者诞生
北京时间周四凌晨1点,全球顶级技术大会微软Ignite正式在西雅图揭幕,微软CEO萨蒂亚·纳德拉进行了接近1个小时的开幕演讲,介绍了AI龙头取得的最新进步。纳德拉表示,在本周的大会上,微软又能拿出100多项有关AI的更新,但与过去一样,他会在今天的演讲中着重提到5个方面。
韩央行称未来 20 年韩国 400 万工作岗位可能被 AI 取代
韩国央行周四发布的一份研究报告称,未来20年,人工智能可能会取代多达400万个工作岗位,占韩国工作岗位总量的14%。这一研究结果进一步警告了世界各地劳动力市场即将出现的混乱。
OPPO ColorOS 14 首次接入 AI 大模型,全新小布已接入 AndesGPT
在今日的发布会上,OPPO 带来了全新的 ColorOS 14,主打更智慧、更流畅、更安全;同时,OPPO 还推出了个人专属的大模型服务 AndesGPT,并带来潘塔纳尔智慧跨端系统落地。AndesGPT 是一款千亿参数的对话增强语言模型,具备知识、记忆、创作与工具能力,支持端云协同全场景智能调度。
金山办公 WPS AI 今日起开启公测,面向全体用户陆续开放体验
金山办公宣布,WPS AI 今日起开启公测,面向全体用户陆续开放体验。WPS AI 的功能覆盖文字、表格、演示几个方面。
微软推出 Copilot Studio,允许用户构建自定义 AI 助手
上周 OpenAI 宣布推出新的 GPTs 平台,让任何人都可以创建自己的 ChatGPT 版本,现在微软也推出了 Copilot Studio:一种新的无代码解决方案,可以让企业创建自定义 Copilot 或集成自定义 ChatGPT AI 聊天机器人。
微软推出两款自研的企业人工智能芯片:“Maia”和“Cobalt”
微软宣布推出两款新的企业内部芯片:Azure Maia 100 和 Azure Cobalt 100,以加强其计算基础设施业务。Maia 是其以人工智能为中心的 GPU,旨在为生成人工智能工作负载运行基于云的训练和推理。同时,Cobalt 是一款基于 Arm 的芯片,旨在高效处理通用工作负载。这两项产品将于明年部署在 Azure 中,首先是微软自己的数据中心驱动其Copilot和 Azure OpenAI 服务。
微软放弃 Bing Chat 品牌,将重命名为 Copilot
微软今年早些时候推出了 Bing Chat,作为其 Bing 搜索引擎的一部分,将类似 ChatGPT 的界面直接集成到其搜索结果中。在微软 Ignite 技术大会上,微软宣布放弃 Bing Chat 品牌并转向 Microsoft Copilot,后续用户可能在 Bing、Microsoft Edge 和 Windows 11 中看到聊天界面的新名称 Copilot。
生成式人工智能初创公司 Tech Spark AI 获 140 万美元
Pre-seed 轮融资 人工智能公司 Tech Spark AI 周三宣布进行 140 万美元的 Pre-seed 轮融资,以构建一个名为 Spark Plug 的新生成式人工智能平台。本轮融资由道明银行 (TD Bank) 领投,Salesforce、加拿大政府和 NBA 加拿大公司参投。
2023年11月15日·周三
腾讯云全面升级向量数据库多项核心性能,最高支持千亿级向量规模
在腾讯云向量数据库技术及产业峰会上,腾讯云全面升级向量数据库多项核心性能,最高支持千亿级向量规模和500万QPS峰值能力,同时和信通院一起联合50多家企业共同发布了国内首个向量数据库标准,推进向量数据库及大模型相关产业走向大规模应用。
滴滴组建大模型团队,将落地部分个人出行和企业差旅场景
36氪从多名独立信源处获悉,近期滴滴内部已经组建大模型团队。该团队由滴滴出行地图与公交事业部负责人、算法委员会轮值主席柴华担任技术负责人。不过,即便柴华挂帅,滴滴大模型落地的场景并非地图导航,而是To B的商旅。几名知情者表示,滴滴大模型计划以部分个人出行和企业差旅为场景,用以提升用户差旅、出行规划效率。
OPPO 将于明日发布千亿参数安第斯大模型
OPPO将于明日发布个人专属、对话增强的安第斯大模型(AndesGPT),基于千亿参数的对话增强语言模型,具备知识、记忆、创作与工具能力的智能体。
智能运维初创公司「鼎茂科技」获亿元级B轮融资
近日,鼎茂科技宣布完成亿级人民币B轮融资,由张江科投,国泰君安证裕投资、久立投资参与和老股东涌铧投资和彬复资本跟投。鼎茂科技在2016年开始聚焦AIOps领域,以智能运维产品切入IT运维市场,目前已构建覆盖“IT运维-安全运营-业务辅助决策”的AIOps全领域应用体系。
过去10个月访问量前50的AI工具累计超240亿次访问,仅ChatGPT就占了60%的流量
Writerbuddy 使用SEMrush 统计了 2022 年 9 月至 2023 年 8 月期间的网站流量数据,排名前 50 的人工智能工具吸引了超过 240 亿次访问。其中 ChatGPT 以 140 亿次访问量遥遥领先,占分析流量的 60% 以上。来源: Writerbuddy
使用量过大,Open AI暂停ChatGPT Plus新用户注册
OpenAI首席执行官萨姆·奥特曼(Sam Altman)在X(原推特)上表示,“我们将暂停新的ChatGPT Plus用户注册。开发日后使用量的激增已经超出了我们的承受能力,我们希望确保每个人都有良好的体验。你仍然可以在应用程序内注册,以便在订阅者重新开放时收到通知。”
微软必应聊天 nosearch 模式初体验,可通过插件启用 / 禁用
微软近日以插件的形式,邀请部分必应聊天(Bing Chat)用户,测试“nosearch”模式。用户开启该模式之后,不依赖互联网的海量信息来回答问题,而是提供更精确、更相关的信息,符合用户的偏好和需求。
李彦宏:百度目前20%代码由AI完成 基础大模型过多是浪费
今日在深圳举行的西丽湖论坛上,李彦宏表示,百度已坚决对旗下各产品线进行AI原生化重构,百度每100行代码,20行就由AI完成。他表示,大模型是基础底座,类似操作系统不会太多,重复开发大模型是对基础资源的浪费。 文心一言有了很大进步,其调用量比国内其他两百家还多。目前文心一言已有800万开发者,开发者可以通过插件调用文心一言。
谷歌 DeepMind 发布 AI 天气预报模型 GraphCast,速度和准确度超越传统方法
在预测全球未来10天的天气状况方面,人工智能(AI)首次超越了传统的预测方法。谷歌DeepMind周二发表在《科学》杂志上的论文中表示,其AI模型GraphCast AI“标志着天气预报领域出现了拐点”。在1380项指标中,GraphCast AI在90%的指标上优于ECMWF的系统。GraphCast AI在谷歌TPU v4云计算机上运行,1分钟内就可以生成10天内的天气预报。
爱彼迎 Airbnb 收购人工智能初创公司 GamePlanner.AI
Airbnb 于当地时间周二宣布收购了一家 12 人规模的人工智能初创公司 GamePlanner.AI,交易金额未公开,Airbnb 拒绝透露更多关于该交易的细节。据 CNBC 援引知情人士的消息称,这笔交易的价值略低于 2 亿美元。值得一提的是,GamePlanner.AI 由 Adam Cheyer 创立,而他正是苹果语音助手 Siri 的创始人之一。这家初创公司将补充 Airbnb 现有的一系列人工智能技术,包括大语言模型、计算机视觉模型和机器学习等方面。
Notion 推出问答功能,可 AI 智能询问和检索笔记内容
Notion 是一款流行的笔记、文档和数据库一体式协作应用程序,最新发布了一项名为“Q&A”问答的新人工智能功能,该功能允许用户通过查询和检索存储在其 Notion 工作区中的信息和笔记来获得问题的即时答案。
2023年11月14日·周二
京东 App 上线京言 AI 助手测试版:提供专业品类咨询、产品对比等功能
据IT之家报道,京东 App 现已上线京言 AI 助手测试版,用户搜索“京东京言”后点击即可进入。据介绍,京言 AI 助手一款 AI 智能导购助手,可以为用户提供以下功能:专业品类咨询、个性化送礼助手、产品对比助手、购物经验知识。
零一万物回应架构争议:其研发大模型基于GPT成熟结构,对模型和训练做了大量工作
李开复旗下AI企业零一万物开源大模型被指责完全使用LLaMA的架构 ,只对两个张量(Tensor)名称进行修改。对此,零一万物表示:GPT是一个业内公认的成熟架构,Llama在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。
夸克 App 推出自研大模型:千亿级参数、CMMLU 榜单第一
阿里巴巴智能信息事业群发布今日发布了夸克大模型,该模型优先落地在通识问答、专业搜索等信息服务领域,将应用于夸克旗下一系列 App 中,令 App 变身为“AI 助手”。据悉,夸克大模型号称“全栈自研、千亿级参数”,在 CMMLU 大模型性能评测中位列榜首,号称整体能力已经超过 GPT-3.5,在写作、考试等部分场景中优于 GPT-4。
电商零售领域 AI 应用初创公司「极睿科技」获数千万美元B轮融资
极睿科技是一家专注于电商零售领域AI应用的初创公司,定位为“AI电商全链路内容工厂”,近日完成数千万美元B轮融资,投资方为顺为资本。此前,极睿科技还曾获得来自红杉资本、图灵创投的亿元级A轮融资,以及金沙江创投、魔量资本的数千万元Pre-A轮投资。
李开复旗下 AI 公司“零一万物”开源 Yi 大模型被指抄袭 LLaMA
创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司“零一万物”,该公司已推出 Yi-34B 和 Yi-6B 两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。然而在 Yi-34B 的 Hugging Face 开源主页上,开发者 ehartford 质疑称该模型使用了 Meta LLaMA 的架构,只对两个张量(Tensor)名称进行了修改。
英伟达:B100 芯片将于明年推出,AI 表现性能是 H200 两倍以上
英伟达日前透露,2024年推出的Blackwell架构B100 GPU,在GPT-3 175B推理性能标竿方面击败A100、H100及H200,其AI表现性能将是Hopper架构H200 GPU两倍以上。市场预计,英伟达将委托台积电以3nm制程代工Blackwell GPU,英伟达计划将生产时间点提前至2024年Q2。
清华联合面壁智能发布自动化新范式APA,将Agent引入RPA
近日,面壁智能联合清华自然语言处理实验室等机构的研究人员共同发布了新一代流程自动化范式 Agentic Process Automation,该范式不仅实现了工作流构建的自动化,更在工作流执行时引入了动态决策的自动化。
消息称三星高斯 AI 大模型支持中文,有望用于国行 Galaxy S24 系列手机
根据博主 @Tech_Reve 爆料,三星高斯的语言模型不仅支持韩语,还支持英语、法语、西班牙语、中文和日语。也就是说,国内用户也有望在后续体验到高斯大模型。此外,三星宣布明年初推出 Galaxy AI,将端侧 AI 大模型带到新的 Galaxy 旗舰手机中(预计为 Galaxy S24 系列)。
谷歌携手 UC 伯克利推出新方法生成式 AI 方法“IGN”,可单步生成逼真图像
谷歌近日携手加州大学伯克利分校(UC Berkeley),研发出了可取代扩散模型(Diffusion Models)的全新生成式 AI 方法–幂等生成网络(IGN)。
英伟达发布新一代AI芯片H200,性能最高提升90%
北京时间11月13日晚间消息,英伟达发布了新一代人工智能(AI)处理器H200。这是一款图形处理器(GPU),旨在培训和部署各种人工智能模型。新的H200 GPU是当前H100的升级产品,集成了141 GB的内存。在用于推理或生成问题答案时,性能较H100提高了60%至90%。
微软 AI 助手 Copilot 已与 Edge 浏览器 PDF 文件集成
近日,有网友在 Twitter(现名为 X)上发现,微软的 AI 助手 Copilot 现已与 PDF 文件集成。这意味着用户可以在使用 Edge 浏览器打开 PDF 文件时,直接使用 Copilot 的功能,从而更方便地获得工作和创作方面的帮助,以提高效率。
芬兰人工智能初创公司 Silo AI 推出开源大模型 Poro
总部位于芬兰赫尔辛基的人工智能初创公司 Silo AI 本周推出了一个新的开源大语言模型 Poro,该模型拥有 342 亿参数,基于在 21 万亿 token 多语言数据集的一部分上进行训练,涵盖英语、芬兰语以及 Python 和 Java 等编程语言。
人工智能法律助手 Jimini AI 获 190 万欧元种子轮融资
法国的法律人工智能初创公司 Jimini AI 宣布已完成 190 万欧元种子轮融资,该平台允许用户以自然语言与AI助手进行交互,提出法律问题,与法律文件交互,或根据公司的先例起草合同。
2023年11月13日·周一
T3出行联手中国电信打造国内首个出行大模型“阡陌”
日前,在广东省人民政府与中国电信联合主办的“2023数字科技生态大会”上,T3出行宣布与中国电信达成战略合作。双方将共同打造国内出行行业首个生态大模型——“阡陌”,逐步推出各类出行场景大模型解决方案,赋能产业链上下游企业,为智慧交通和智慧城市落地注入新动能。
万字长文:AI的安全与光明的消逝
究竟要不要AI监管?AI监管会带来什么样的后果?MOOC课程和深度学习框架fast.ai的一群研究者们,开展了一项调查研究,采访了70多名专家,并查阅了300多篇学术论文。最终形成结论:我们正处在AI启蒙阶段,严格的监管势必要扼杀希望的萌芽。
古尔曼爆料:苹果iOS18更新将是开创性的,或将引入生成式AI技术
苹果知名爆料人古尔曼最新写道,苹果公司内部将其iOS 18系统称为是“雄心勃勃、引人注目的”。iOS 18将在性能和安全性方面有重大改进,将是相对具有开创性的。古尔曼还认为,iOS 18准备将生成式AI技术引入iPhone。
比尔·盖茨发文称:AI智能体将彻底改变人机交互、颠覆软件行业
近日,比尔·盖茨在最新发布的一篇长文中为 AI Agent(智能体)送上了诸多溢美之词,“一个对科技行业的冲击波”、“一场自‘输入命令到点击图标’变革之后计算机领域的最大变革”。在盖茨的预期中,未来五年内,我们便有望正式迎来 AI Agent。它将成为“下一个平台”,如今各自为政的电商、搜索引擎、广告等业务,都将归为一个整体。
OpenAI CEO 寻求微软进一步的资金支持以打造“超级智能”
OpenAI 的 CEO Sam Altman 在接受英国《金融时报》的采访时表示,计划从其最大投资者微软获得进一步的财务支持,以进一步推进其愿景,即创建通用人工智能 (AGI)。
广东:目标到2025年,智能算力规模实现全国第一、全球领先
广东省人民政府发布关于加快建设通用人工智能产业创新引领地的实施意见。目标到2025年,智能算力规模实现全国第一、全球领先,通用人工智能技术创新体系较为完备,人工智能高水平应用场景进一步拓展,核心产业规模突破3000亿元,企业数量超2000家。
精密零组件 AI 制造「量匠」完成千万元天使轮融资
精密零组件端到端的AI自主制造工厂「量匠」已经于近日完成上千万元天使轮融资,本轮融资投资方为九合创投领投,相关产业个人天使投资人跟投。该轮融资将被用于核心技术研发,推动行业智能化改造,团队搭建和运营和业务拓展。
2023年11月12日·周日
元象 XVERSE 大模型向全社会开放
元象大模型宣布已通过《生成式人工智能服务管理暂行办法》备案,将陆续向公众开放服务。元象大模型是由深圳元象XVERSE从头训练、全链路自主研发的高性能通用大模型系列,现已成功研发XVERSE-7B、13B、65B等多个量级的高性能大模型,并且全部开源,免费商用。
网易有道上线“易魔声”开源语音合成引擎,支持 2000 多种音色
网易有道日前正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区 GitHub 进行下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,实现音色的情感合成与应用。
2023年11月11日·周六
视频初创公司 RunwayML 发布 Motion Brush 功能,可选择图像的局部运动起来
文本转视频初创公司 RunwayML 刚刚发布了“Motion Brush”,它可以让你选择图像的特定区域并让它们运动起来。该功能即将在 Runway 的 Gen-2 模型中推出,该模型刚刚在保真度和一致性方面进行了重大升级。该更新还允许 Gen-2 在从现有图像创建视频时处理更高分辨率 2816 x 1536 像素,超过当今广泛使用的全高清分辨率。
谷歌正在洽谈向 AI 初创公司 Character.AI 投资数亿美元
谷歌正在商谈向聊天机器人制造商Character.AI投资数亿美元。两位知情人士透露,这家快速发展的人工智能聊天机器人初创公司正在寻求资金来训练模型并满足用户需求。Character.AI一直在使用谷歌的云服务和张量处理单元(TPU)来训练模型。
OpenAI 推出企业定制版 GPT-4,起步价 200 万美元
本周早些时候,除 OpenAI 开发者大会外,该公司还低调推出了定制化 GPT-4 模型的服务。根据 OpenAI 的说法,它会选择一些特定客户,基于这些客户自己的私有数据,构建定制化的 GPT-4 模型,生成针对每个客户业务的自定义结果。OpenAI 还表示,每个客户的定制流程需要花费几个月的时间,起步价为200万美元。
来源: 华尔街见闻
代码托管和开发社区 GitLab 推出 AI 编程聊天机器人 Duo Chat
GitLab 今天推出了 Duo Chat,这是一款新的对话式 AI 工具,允许开发人员通过自然语言对话与其现有的 Duo AI 功能进行交互。通过类似于 ChatGPT 的界面,Duo Chat 可以让开发人员按需获得代码解释、生成测试、总结问题、创建代码等。
2023年11月10日·周五
“智谱 AI”正以200亿元估值进行新一轮融资,此前阿里腾讯等已投资25亿
据钛媒体报道,阿里、腾讯已投资的人工智能(AI)大模型独角兽公司智谱 AI,正在以200亿元估值进行新一轮融资。早在10月20日,智谱AI 宣布今年以来已累计融资额超过25亿元人民币,投资方包括美团、蚂蚁、阿里、腾讯、小米、金山、顺为、红杉、高瓴等机构。当时财新报道称,公司估值已超过100亿元。
英伟达确认将为中国“定制”三款AI芯片,本月16日正式推出
据银柿财经报道,针对此前有关英伟达将推出三款针对中国区的最新改良版 AI 芯片的消息,英伟人达内部士表示,消息属实,本月 16 日将正式推出。此外,英伟达公司美国总部回复称:“很感谢和我们联系,我们对这个消息目前还没有任何评论。”
AMD 将于 12 月 7 日举办 Advancing AI 特别活动,预计将推出 MI300X GPU
AMD 宣布将于北京时间 12 月 7 日凌晨 2 点举办一场专门针对 AI 的特别活动,名为“Advancing AI”,预计此次活动可能与 MI300X 数据中心 GPU 发布有关。
中国电信发布千亿参数大模型「星辰语义」
在2023数字科技生态大会上,中国电信接连发布了一站式智算服务平台“慧聚”、大模型星辰语义及十余个行业大模型、中国电信“天衍”量子计算云平台、5G焕新应用等多项产品、平台及技术更新。星辰语义大模型是中国电信自研大模型的升级,由此前的百万参数量级升至千亿,升级后抑制幻觉、外推窗口、交互体验、多轮理解四大能力均有显著提升。
OpenAI 自定义 GPTs 功能正式上线,对所有 ChatGPT Plus 用户开放
OpenAI 联合创始人兼首席执行官 Sam Altman 在社交平台宣布,自定义 GPTs 功能对所有 ChatGPT Plus 用户全面开放。自定义 GPTs 是 OpenAI 在开发者大会上推出的一项重磅功能,用户无需任何代码,全程支持可视化点击操作,即可创建自定义 ChatGPT 助手。
OpenAI寻求合作伙伴生成用于训练 AI 模型的数据集
OpenAI 发文宣布,将与组织合作生成用于训练 AI 模型的公共 / 私有数据集,数据合作伙伴关系旨在“让更多组织能够帮助引导 AI 的未来”并“从更有用的模型中受益”。
AI 医疗成像分析科技公司 Elucid 获 8000 万美元 C 轮融资
Elucid 是一家领先的医疗技术公司,为医生提供人工智能驱动的成像分析软件来评估心血管疾病,该公司今天宣布已筹集8000万美元的 C 轮资金。本轮融资由 Elevage Medical Technologies 领投。
AI 金融分析平台 Eilla AI 获 150 万美元种子轮融资
用于私募市场金融决策的生成人工智能平台 Eilla AI 宣布已筹集 150 万美元种子资金。该平台利用人工智能协助并购、风险投资和私募股权专业人士进行金融研究、分析和文档创建。本轮融资由 Eleven Ventures 领投,Fuel Ventures 参投。
2023年11月09日·周四
百度CTO王海峰:文心一言用户规模已达7000万
在2023年世界互联网大会乌镇峰会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰出席前沿数字技术创新与安全论坛和人工智能赋能产业发展论坛,解读文心大模型4.0最新技术,阐述大模型产业模式。王海峰披露,文心一言用户规模现已达到7000万,场景4300个。
腾讯副总裁蒋杰:腾讯混元大模型已接入 180 多个内部业务
“腾讯正在持续探索大模型应用场景,目前内部超180项业务已经接入腾讯混元大模型进行内测。”11月9日,腾讯集团副总裁蒋杰在2023年世界互联网大会乌镇峰会上表示。
OpenAI 工程师年薪曝光,中位数高达 92.5 万美元
据 Levels.fyi 的薪酬数据显示,OpenAI 软件工程师的中位数年薪高达 92.5 万美元。这是 OpenAI 的五级软件工程师获得的工资,包括 30 万美元的基本工资和 62.5 万美元的股票补偿,五级软件工程师大约有 10 年的工作经验。
阅文CEO侯晓楠:AIGC推动网文规模化出海,翻译成本平均降9成
在2023年世界互联网大会上,阅文集团的CEO侯晓楠透露,在网文出海方面,AI翻译正在突破产能和成本的限制,无论是质量还是效率都表现不错。通过建立专用词库人机配合,阅文的网文翻译成本平均降低了9成,同时效率大幅提升。在侯晓楠看来,AIGC让中国网文的规模化出海真正成为可能,无缝对接全球市场,这是非常有潜力的新蓝海。
钉钉智能化底座 AI PaaS 全量上线
钉钉宣布智能化底座 AI PaaS(平台即服务)全量上线,面向生态伙伴和客户开放。首批与钉钉共创的六家生态伙伴基于 AI PaaS 开发的“数字员工”和智能化应用,已上架到钉钉智能应用市场。
谷歌宣布扩大与 Anthropic 的合作伙伴关系,将为其提供 Cloud TPU v5e 芯片
谷歌宣布扩大与AI初创公司Anthropic的合作伙伴关系,双方的合作将涉及谷歌云的重要产品 Cloud TPU v5e 芯片,它将以更高效的方式为大型语言模型Claude服务。不过 Anthropic 正在采取“多云”方法,也就意味着谷歌并不是它的唯一选择。
英伟达或将推出针对中国区的最新改良版 AI 芯片
记者从产业链人士处了解到,英伟达现已开发出针对中国区的最新改良版系列芯片:HGX H20、L20 PCle 和 L2 PCle。知情人士称,最新三款芯片是由 H100 改良而来,英伟达最快或将于本月16号之后公布,国内厂商最快将在这几天拿到产品。
OpenAI:ChatGPT 服务周期性中断因遭到 DDoS 攻击
OpenAI在官网更新消息称,正在处理因反映DDoS(分布式拒绝服务)攻击的异常流量而导致的周期性中断。此前,OpenAI发文称,ChatGPT和API仍会出现周期性中断。当日更早些时候,OpenAI的ChatGPT和API服务出现严重中断故障,导致面向用户和开发者的服务无法正常使用。
李彦宏谈 AI:只有拥有数以百万计的AI应用,大模型才算得上成功
在2023年世界互联网大会乌镇峰会上,百度创始人、董事长兼首席执行官李彦宏在发言时提到,技术创新的最终目的是应用,人类进入AI时代的标志是出现大量的AI原生应用,而不是出现大量的大模型,大模型可以支撑无数的AI原生应用开发,但只有拥有数以百万计的AI应用,大模型才可以算得上成功。
阿里巴巴即将开源国内规模最大的 AI 大模型,720 亿参数
阿里巴巴集团 CEO 吴泳铭今日在 2023 年世界互联网大会乌镇峰会上透露,阿里巴巴即将开源 720 亿参数大模型,这将是国内参数规模最大的开源大模型。
谷歌 DeepMind 创始人提出通用人工智能分级,ChatGPT 只是初级
近日,谷歌 DeepMind 联合创始人谢恩·莱格(Shane Legg)带领的研究团队发布论文,提出了对通用人工智能(AGI)的更清晰定义,制定了类似于自动驾驶L1-L5级别的AGI分级分类框架。论文中,基于能力深度(性能)和广度(通用性)将AGI分类为:非AI、初级、中级、专家、大师、超级智能。
AIoT 初创公司「阿加犀」完成 Pre-A+ 轮近亿元融资
成都阿加犀智能科技有限公司(以下简称为“阿加犀”)宣布已完成近亿元人民币的Pre-A+轮融资,本轮融资由申能诚毅领投,川发展院士基金跟投。「阿加犀」是一家聚焦AIoT(智能物联网)领域的人工智能平台和产品服务商,为全球客户提供可靠的高性能、高效率人工智能解决方案。
GitHub 宣布 Copilot Chat 功能 12 月全面推出,教育用户及开源项目维护者可免费使用
GitHub 宣布,作为当前 GitHub Copilot 订阅的一部分,GitHub Copilot Chat 将于 12 月全面推出,任何企业和个人用户均可使用,相关服务还将免费提供给教育用户和流行开源项目的维护者使用,默认集成至 GitHub 网站和移动 App 中。
GitHub 将其 Copilot Chat 代码助手引入网页端和移动平台 GitHub
今天宣布对其 GitHub Copilot 产品进行扩展,将其人工智能驱动的聊天机器人直接集成到 github.com 网站和移动应用程序中。通过这些更新,GitHub 旨在使 Copilot 在整个软件开发过程中无处不在。
微软计划为 Windows 10 系统用户也引入 Copilot 助手
微软今年早些时候开始推出适用于 Windows 的新 AI 助手,其中包括 Windows 11 版本 23H2 版本,该版本直接在任务栏中添加了新的 Microsoft Copilot 按钮。消息称,微软计划在即将推出的更新中将相同的 Microsoft Copilot 引入 Windows 10。
2023年11月08日·周三
百度智能云千帆大模型平台再升级,SDK版本开源发布
百度智能云千帆大模型平台再次升级,在原有 API 基础上,百度智能云正式上线 Python SDK 版本并全面开源,企业和开发者可免费下载使用。千帆SDK全面覆盖从数据集管理,模型训练,模型评估,到服务部署等方面的功能,用户可基于千帆SDK通过代码接入并调用百度智能云千帆大模型平台的能力,轻松实现LLMOps全流程的落地,快速构建自己的大语言模型应用。
中国移动董事长杨杰:未来三年生产经营环节应用AI大模型的企业占比将提高至80%以上
2023年世界互联网大会乌镇峰会在乌镇举行,中国移动党组书记、董事长杨杰参加开幕式时称,未来三年,在生产经营环节应用AI大模型的企业占比将由目前的不到5%提高到80%以上。
英矽智能发布AI辅助决策自动化实验室:14天完成靶点发现和验证
AI制药公司英矽智能发布“全球首个由AI辅助决策的自动化实验室”,将人工智能与自动化、机器人和生物学能力融合,既可执行单一任务,如高通量筛选、高内涵成像、二代测序等,也可以实现一体化串联流程,如在14天内完成靶点发现和验证的全自动化干湿实验闭环。
上海发布 11 条措施推动 AI 大模型发展,支持相关人才落户
上海市日前发布关于印发《上海市推动人工智能大模型创新发展若干措施(2023-2025 年)》的通知,推出 11 条措施推动大规模预训练模型创新发展,加快打造人工智能世界级产业集群。优先推荐大模型创新重点人才纳入国家和本市相关高层次人才计划,重点支持大模型相关紧缺技能人才落户。
阿里CEO吴泳铭:在可见的未来,AI助理会无处不在
11月8日上午,2023年世界互联大会乌镇峰会开幕。阿里巴巴集团CEO吴泳铭在会上表示,阿里巴巴正在成为一家开放的科技平台企业,将为千行百业AI的创新和转型提供基础设施。
思谋发布全球首个工业多模态大模型 IndustryGPT V1.0
近日,香港中文大学终身教授、思谋科技创始人兼董事长贾佳亚受邀参加第六届中国国际进口博览会暨虹桥国际经济论坛开幕式,并在虹桥论坛的主题演讲中携团队正式发布全球首个工业多模态大模型 IndustryGPT V1.0。
三星自研大模型 Gauss(高斯)公布:AI 聊天、代码、图片,用于内部员工
在今日的三星人工智能论坛 2023 上,三星官方正式公布了其自研的生成式 AI 产品 Gauss(高斯)。据介绍,该大模型由 Samsung Gauss Language、Samsung Gauss Code 和 Samsung Gauss Image 组成,以建立机器学习和人工智能支柱正态分布理论的传奇数学家约翰・卡尔・弗里德里希・高斯的名字命名。
Figma 旗下 AI 白板工具「FigJam AI」更新,并开启免费公开测试
Figma 以其产品设计应用程序而闻名,该公司宣布推出FigJam AI,这是一套用于其协作白板服务 FigJam 的新生成式 AI 工具套件,可为常见设计和规划项目创建即用型模板。FigJam AI 从 11 月 7 日开始进行公开测试,并且“目前对所有客户级别免费”。
亚马逊正在开发 Olympus AI 以缩小与 OpenAI 和微软的差距
据 The Information 报道,知情人士透露,亚马逊正在开发新款通信类人工智能(AI)软件——“奥林匹斯”AI(“Olympus AI”),预计该软件最快将于12月份宣布。该公司正试图在向企业客户销售此类软件方面赶上 OpenAI 和微软。
IBM 推出 5 亿美元 AI 风投基金,专注于投资生成式 AI 初创公司
IBM 将投入 5 亿美元投资专注于商业客户的生成式 AI 初创公司。该公司近几个月已经投资了 Hugging Face 最近的 D 轮融资和 HiddenLayer 的 A 轮融资。IBM 表示对专注于特定垂直行业(如医疗保健)或特定业务流程的工具的初创公司特别感兴趣,只要该初创公司不与 IBM 自己的业务竞争太多。
Mozilla 正测试人工智能购物聊天机器人 Fakespot Chat
今年早些时候收购 Fakespot 后,Mozilla(火狐浏览器背后的公司)正在将其产品评论智能应用到新的 AI 聊天机器人 Fakespot Chat 中,该机器人旨在回答用户有关正在考虑购买的产品的问题,可以回答有关产品“质量、客户反馈和退货政策”的问题。
2023年11月07日·周二
支付宝上线新功能:免费生成AI写真,还可导出高清图
支付宝近日上线了免费的AI写真功能,在首页直接搜索“AI写真馆”即可进入小程序使用。该小程序的主体信息为支付宝子公司吱信(上海)网络技术有限公司,小程序官方介绍为:1张自拍一键生成个人写真集。目前为限时免费阶段,每天登录小程序就能获得10张胶片,1张胶片可以生成4张写真,做小任务还能获得额外胶片。
马斯克旗下 xAI 推出开发工具 PromptIDE
马斯克旗下 AI 公司 xAI 今发文宣布推出 xAI PromptIDE,一个用于提示工程和可解释性研究的集成开发环境。它通过 SDK 加速提示工程,该 SDK 允许实现复杂的提示技术和丰富的分析功能,从而实现网络输出可视化。
美团旗下首款 AI 聊天产品 Wow 上线应用商店
上海三快省心购科技有限公司开发的一款“Wow”应用日前上架了 iOS 和安卓平台,该公司由美团关联公司上海汉涛信息咨询有限公司 100% 控股。也就是说,“Wow”是美团旗下首款 AI 聊天产品。
OpenAI宣布ChatGPT每周活跃用户数量突破1亿
OpenAI首席执行官山姆·奥特曼在该公司首届开发者大会上宣布,ChatGPT目前拥有1亿周活跃用户。该服务于近一年前发布,发布后两个月内就获得约1亿月活跃用户。
OpenAI ChatGPT 大升级:自定义GPT机器人、GPT-4更新、API大降价等
OpenAI在首届开发者日上,正式公布自定义GPT,还将上线“GPT商店”,与创作者分享收入。与此同时,现有的GPT-4也迎来一大波更新。新版本GPT-4 Turbo,支持128k上下文,知识截止更新到2023年4月,视觉能力、DALL·E3,文字转语音TTS等等全都对API开放。此外,API价格还打了3-5折。
德国生成式 AI 初创公司 Aleph Alpha 获 5 亿美元 B 轮融资
德国 AI 初创公司 Aleph Alpha 日前表示,该公司已在博世、SAP 和惠普企业等公司的支持下筹集了 5 亿美元资金。该公司已经建立了自己的大型语言模型,并在 B 轮融资中筹集了新的现金,这是该公司的第二轮主要融资。筹集的新资金将用于基础模型、先进产品功能和软件商业化的研究。
微软必应聊天已无缝集成 Excel,可快速对数据进行编辑
微软必应聊天机器人功能越来越多丰富,最近该工具还无缝集成了 Excel,可提高用户的工作效率。当必应聊天的答案中包含数据表格时,用户可以在表格的第一行看到一个“在 Excel 中编辑”的按钮。
2023年11月06日·周一
联发科发布天玑 9300 旗舰 5G 生成式 AI 移动芯片
联发科举行天玑旗舰芯片新品发布会,正式发布新一代旗舰5G生成式AI移动芯片“天玑9300”。这是天玑首款“4(超大核)+4(大核)”全大核AI旗舰芯片,支持终端运行10亿、70亿、130亿、最高可达330亿参数的AI大语言模型。
脉脉高聘发布2023年人工智能人才洞察:新发AI岗位平均薪资超4.6万元
近日,脉脉高聘人才智库发布《2023泛人工智能人才洞察》(以下简称《洞察》)。《洞察》显示,2023年1-8月,新发AI岗位平均月薪超4.6万元,人才供需比仅为0.39,相当于5个岗位争夺2个人才。纯互联网行业成为人工智能新发岗位量最高的行业,占比为20.78%。
零一万物推出 Yi 系列开源大模型:Yi-6B 和 Yi-34B
Yi系列模型是由李开复创立的AI公司零一万物(01.AI)的开发人员从头开始训练的大型语言模型。第一个公开版本包含两个双语(英文/中文)基础模型,参数大小分别为 6B 和 34B。两者都以 4K 序列长度进行训练,并且在推理期间可以扩展到 32K。
HydroX AI 完成400万美元天使轮融资,为大模型安全提供解决方案
HydroX AI近日完成400万美元天使轮融资,由绿洲资本领投,奇绩创坛,Atom Capital跟投。本轮融资资金主要用于产品研发,市场拓展以及扩大团队规模等。该公司致力于为大模型公司、使用大模型的企业以及其他B2B行业的客户提供全方位、多层次的AI安全解决方案。
元象 XVERSE 开源 650 亿参数通用大模型 XVERSE-65B
元象XVERSE宣布 开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构,参数规模达到了650亿。
蚂蚁百灵AI大模型将向公众开放
记者从蚂蚁集团获悉,基于百灵大模型的多款产品已陆续完成内测,将向公众开放。蚂蚁百灵语言大模型采用Transfromer架构,基于万亿级Token语料训练而成,支持窗口长度为32K。另据了解,在基础大模型层面,除了本次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。
李开复创立的AI公司零一万物估值已超10亿美元
李开复近日在接受媒体采访时表示,其创立的人工智能公司零一万物(01.AI)经过一轮融资后,估值已超过10亿美元。李开复于今年3月开始组建零一万物的团队,并于6月开始运营。该公司开源的基础大型语言模型Yi-34B现已向全球开发者提供中英文版本。
2023年11月05日·周日
OpenAI 首届开发者大会全新 ChatGPT 原型 Gizmo 被提前曝光
两天后,OpenAI 的首届开发者大会就要来到了。关于 OpenAI 要发什么还是有了爆料消息,引发了网友的热议。消息源来自 X 用户 CHOI,他表示 OpenAI 将公布 ChatGPT 的重大更新,包括全新的界面以及一些新功能:自定义聊天机器人、与谷歌和微软的连接器以及新的订阅模式。
奇元大模型通过备案,360自研两大模型均获批
11月4日,360大模型“奇元大模型”通过备案落地。今年9月,“360智脑大模型”已获批面向公众开放。360公司也成为国内首家两个大模型均通过备案的科技企业。
2023年11月04日·周六
香港生成式AI研究发展中心启动 将成香港AI研发核心枢纽
在香港特区政府支持下,由香港科技大学主导,联合香港大学、香港中文大学、香港理工大学和香港城市大学,共同合作成立“香港生成式AI研究发展中心”(简称“中心”)于11月份正式启动研究工作。
比 ChatGPT 等竞品更幽默,马斯克 xAI 推出首个产品 Grok
马斯克今天发布推文,宣布 xAI 公司的人工智能产品名为 Grok。马斯克认为相比较 OpenAI 的 ChatGPT、谷歌的 Bard 和微软的 Bing Chat,Grok 最大的不同是存在幽默感。Grok 结束早期测试后,会向近期添加的 X Premium+ 用户开放。
美团、昆仑万维、面壁智能等9个 AI 大模型获批
今天起对外开放使用 网易有道(“子曰”大模型)、面壁智能(“面壁露卡Luca”)、出门问问(“序列猴子”)、昆仑万维(“天工”大模型)、美团(模型)、知乎(“知海图AI”模型)、月之暗面(moonshot)、金山办公(WPS AI)、好未来(MathGPT大模型)这 9 家公司的 AI 大模型产品获批,今日起面向全社会开放服务。
昆仑万维“天工”大模型通过备案,即日起面向全社会开放服务
昆仑万维集团今日通过公众号宣布,昆仑万维天工大模型现已通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务,用户可通过官方 App、官网直接注册使用。
知乎“知海图AI”大模型宣布开放服务,将赋能多个业务场景
知乎宣布旗下的“知海图AI”大模型即将面向社会公众开放服务,知乎将择机上线相关产品,持续赋能创作者、讨论场、信息获取、内容运营等各项业务场景。
面壁智能大模型即日起开放公众服务
11月4日,面壁智能多模态大模型应用「面壁露卡Luca」正式面向公众开放服务。广大用户可访问 https://luca.cn 注册使用,开启 Luca 最新体验。