AI创投周报|ChatGPT多模态能力上线Anthropic获亚马逊投资的40亿美元融资

栏目: 媒体报道 发布时间: 2024-03-27 |   作者: 半岛体育平台怎么样

  原标题:AI创投周报|ChatGPT多模态能力上线,Anthropic获亚马逊投资的40亿美元融资

  AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。

  1.ChatGPT多模态能力即将上线,ChatGPT将能处理音频和视频内容,这个要由GPT-4V大模型支持。此外,OpenAI的Sam Altman被曝与孙正义,苹果原设计总监Ive合作打造AI硬件。

  2.Anthropic获亚马逊投资的40亿美元融资,此前Anthropic已累计获得7亿美金融资,新融资将支持它继续紧追OpenAI(OpenAI被曝估值已超过800亿美元),而这也被认为是亚马逊为了与微软和谷歌在AI领域竞争的重要动作。

  3.DeepMind创始人斩获“诺奖风向标”拉斯克奖,同时获奖的还有John Jumper,该奖项奖励了他们联合发明的AlphaFold在蛋白质三维结构预测方面做出的革命性贡献。

  9月25日,OpenAI宣布对ChatGPT进行重大更新,推出了多模态功能,这使ChatGPT能够基于图像做多元化的分析和语音对话。

  新的图像识别功能允许用户上传图像与模型进行交互,可应用于多种日常场景。此外,移动端App还将加入语音合成选项,使用户能与AI助手进行口头对话。ChatGPT的新语音合成功能由OpenAI的新文本到语音模型驱动,用户可在应用设置中选择语音对话,并从多种合成声音中选择。OpenAI计划在未来两周内向Plus和Enterprise订阅者推出这些新功能。

  在背后支撑一切的是GPT-4V大模型,这个模型背后的技术大多数来源于GPT-4。为确保GPT-4V更安全,OpenAI在内测期间开展了大量对齐工作,进行了定性和定量评估、专家红队测试、以及缓解措施。

  OpenAI目前估值已达800亿至900亿美元,成为全世界估值最高的初创公司之一。微软目前持有OpenAI 49%的股份。OpenAI预计今年的收入将达到10亿美元,而到2024年,公司收入会更高,达到几十亿美元。

  2.Sam Altman被曝与苹果传奇设计师、软银孙正义秘密接触,全新AI硬件酝酿中

  OpenAI的CEO Sam Altman近期被曝正在秘密接触前苹果首席设计师Jony Ive和软银集团CEO孙正义探讨全新AI硬件的可能性。这一消息震动了科技界,引发了对未来AI硬件产品的广泛猜测。

  有观点认为,如果合作成功,可能会见证设计、科技和硬件三方面的顶尖人物的联合,将是一次具有历史意义的结盟。

  目前为止,Altman已经投资了一家消费硬件初创公司Humane,并是该公司最大的投资者之⼀。此公司由苹果前员工Imran Chaudhri和软件工程师Bethany Bongiorno创立。Humane计划开发一种无屏幕的可穿戴设备,通过语音提示和手势做相关操作,同时将信息投射到物体表⾯。

  自去年发布后,斯拉的人形机器人“擎天柱”近期展示了其令人震惊的能力和进展。它采用了端到端的神经网络,能够精准分类物体和维持身体平衡。它可以自主对对象进行排序,精确操控手部和腿部的动作,更高效地学习各种任务。

  它能够自动分类不一样的颜色的积木块,即便在干扰下也能保持工作。擎天柱还展示了自主纠正的能力,能够在积木倒下时将其重新摆正。此外,它还能执行与之相反的动作,如将积木再拿出来。

  特斯拉的这一创新不仅是在机器人技术方面的突破,更是在AI技术的应用和发展上迈出了重要一步。

  近日,生理学和医学领域的顶级大奖拉斯克(The Lasker Awards)奖揭晓,今年拉斯克奖的基础医学研究奖授予了来自Google DeepMind的Demis Hassabis(创始人)和John Jumper,他们发明的AlphaFold在蛋白质三维结构预测方面做出了革命性的贡献。

  AlphaFold是一种AI系统,能够仅基于氨基酸序列(1D)预测蛋白质结构(3D)。这一突破性技术已改变了生物学研究的格局,使科学家能更深入地研究蛋白质,以了解其生物功能并指导药物的开发。AlphaFold的精确度可与实验技术相媲美,其源代码和庞大的蛋白质数据库已向公众开放。

  德国客户服务巨头SAP近日发布了一款名为“Joule”的新AI助手,旨在为企业客户“赋能”,帮他们实现更好的业务成果。

  Joule的能力包括多语言回答问题和基于SAP各种服务和第三方数据源提出解决方案。这使得Joule在如帮助制造商识别销售问题和提供与供应链相关的可行解决方案等场景中具有极高的价值。

  Joule将整合到SAP的全面云企业套件中,使客户能够跨SAP应用和程序进行访问,类似于微软的Windows Copilot。SAP已经构建了一个“AI基础设施”,确保Joule和其他SAP AI产品可提供可信、安全、私密且符合合规的AI。

  阿里巴巴近期开源了一款名为Qwen-14B的大语言模型,其参数量达到140亿。Qwen-14B在多个任务榜单中均取得了第一的成绩,超过了Meta的340亿参数Llama 2版本。该模型的训练数据量达到了3万亿tokens,涵盖了中英文,并且序列长度可达8192。

  Qwen-14B不仅在语言理解方面表现卓越,还展现了出色的代码编写能力,例如能够编写出完整的贪吃蛇游戏代码。此外,该模型还能自行调用工具,执行Python代码,进行数学计算、数据分析和数据图表绘制等。阿里巴巴此前还开源了Qwen-7B和Qwen-VL模型,分别具备中英文通用模型和视觉语言大模型的功能。

  近年来,文生图(Text-to-Image)领域在AIGC时代取得了巨大进展。但现有模型在稳定生成包含文本的图像方面仍面临挑战,生成的文字部分常常是不可读的。

  为解决这一问题,研究者提出了TextDiffuser模型,它能更灵活、全面地生成包含易读文本的高质量图像,有助于辅助设计师的工作并激发设计灵感。

  TextDiffuser模型包含两个阶段,第一阶段生成Layout,第二阶段生成图像。模型接受一段文本Prompt,根据Prompt中的关键词确定每个关键词的Layout,然后渲染出文本。TextDiffuser在文本渲染领域取得了显著的进展,未来将逐步提升其效果。

  8.AI独角兽Cohere提出新方法:只需更新0.32%的参数就能完成模型微调

  由Transformer论文作者Aidan联合创立的AI独角兽Cohere近日提出了一种极其参数高效的AI模型微调方法,该方法结合了混合专家(MoE)方法与参数高效型微调(PEFT),仅需更新不到1%的参数,就能让微调后的模型在陌生任务上实现与完全微调模型相当的性能。

  这一新框架名为Mixture of Vectors(MoV)和Mixture of LORA(MoLORA),很适合大规模Transformer模型,它能在有限的计算环境中发挥MoE的优势,显著减少内存消耗和计算开销。Cohere的这一突破性研究为AI领域带来了新的可能性,使得在更加现实和受限的设置中使用MoE成为可能,为未来的AI模型开发和应用提供了新的方向和思路。

  最近,研究人员发现了大模型在逻辑推理方面的主要缺陷,即“逆转诅咒”(Reversal Curse),GPT和Llama都没办法避免。这一问题表现为,当模型学会“A是B”这一知识后,却无法正确推理出“B是A”。

  例如,模型能正确回答“奥拉夫·朔尔茨是谁?”(德国第九任总理),但无法回答“德国第九任总理是谁?”。这一现象不仅出现在合成数据的实验中,还在实际名人及其父母的事实测试中得到验证。

  研究人员尝试了多种方法来解决这一问题,例如使用不相同大小的模型,改变训练数据集中句子的形式,但这一些方法都未能实现模型的泛化。这一发现引起了广泛关注,有的人觉得这揭示了训练数据和上下文在知识泛化过程中的重要性。未来的研究将进一步探索大模型是否能逆转别的类型的关系。

  Anthropic被视为OpenAI的主要竞争对手,最近获得了亚马逊高达40亿美元的投资。它由OpenAI的前研究副总裁Dario Amodei和GPT-3论文的第一作者Tom Brown等人于2021年共同创立。

  它的基本的产品是与ChatGPT直接对标的Claude系列人工智能助手,最新的Claude 2可以在一定程度上完成更长文本的响应,并在编程、数学、推理等方面有大幅提升。

  Anthropic此前已经获得超过7亿美元的资金,企业投资者包括谷歌和SK Telecom。亚马逊的投资将使Anthropic使用亚马逊的AWS进行关键任务工作负载,并利用AWS Trainium和Inferentia芯片来构建、训练和部署其未来的基础模型。

  Anthropic的模型已在多个行业得到应用,包括法律、资产管理和旅游。此次亚马逊的投资被视为是微软、谷歌和亚马逊之间的“大战”的一部分。

  Pryon是人工智能驱动的企业搜索服务平台,它直接对标亚马逊的Kendra。Pryon利用连接器来统一和索引数据库中的信息源,该平台可以与第三方聊天机器人交互,提取音频、图像、文本和视频等非结构化数据,并将其转换为可由连接到它的任何前端搜索和使用的格式。

  Pryon声称它的准确度比Kendra高2倍,提取数据的速度快10倍,并能索引数十亿文档,而Kendra的文档限制为十万个。Pryon以保护隐私的方式在平台上创建,更新或删除内容只需要不到一秒钟的时间,而且该平台不会留下任何索引工作的痕迹。

  Pryon的创始人Igor Jablokov曾经领导了IBM的多模式AI研究团队,并且创立了语音识别初创公司Yap,此公司后被亚马逊收购。

  Writer声称自己的竞争优点是更困难,更深层的用例,这些用例需要增强检索、数据收集清理以及工作流程构建。它允许客户将其模型连接到业务数据源,以提高其研究、事实核查和回答问题的能力。此外,Writer允许公司在其平台上的模型中执行监管、法律和品牌规则。

  它技术上的独特之处在于,它在不受版权保护的商业写作上训练了其可微调的模型,在美国AIGC作品的版权仍然有些模糊的现状下,这可能是一个重要的优势;公司还表示其模型比中等水准“小”,因此更具“性价比”。

  Writer由May Habib和Waseem AlShikh于2020年共同创立。Habib毕业于哈佛大学,曾担任雷曼兄弟的分析师;AlShikh则在多家公司担任过高级软件工程师,同时是CloudAppers的工程总监和iMENA的CTO。二人都是成功的连续创业者,曾经联合创立了软件研发企业Qordoba。

  Corti利用人工智能帮助医疗保健提供商在正确的时间为患者提供正确的医疗保健。它近期获得由Prosus Ventures和Atomico共同领投的6000万美元B轮融资,Eurazeo、EIFO和Chr.等现有投资者也参与了投资,其累计融资超过8600万美元。

  Cortize为医疗保健专业技术人员提供AI助手,帮助医生在与患者互动过程中提供优质的护理,同时将管理工作量降至最低。

  它的AI助手涵盖了许多可能适用的领域:在患者互动期间进行分类,记录整个互动,包括机构可能使用的管理编码,对这种互动做多元化的分析,以指导决策,有时给出可能与临床医生想法相反的“第二意见”,并在实时和会后提供注释,以确定需要改进的领域并培训临床医生。

  Cortize由Andreas Cleve(CEO)和Lars Maaløe(CTO)联合创立,他们都在AI和软件方面有丰富经验。Cleve是成功的连续创业者,是Ovivo的联合发起人;Lars Maaløe则是丹麦技术大学的机器学习博士,在苹果、Issuu等多家公司担任机器学习研究员。

  qbiq的生成式AI和可视化平台可以在几分钟内生成优化的房屋布局和3D可视化,而传统方法在大多数情况下要几周时间。用户都能够在这样的平台上输入空间布局和设计的基本要求,平台则提供量身定制的规划包。

  qbiq使房产经纪人、房东和建筑师能够更快地做出决策、更有效地完成交易、降低空置率并提高规划能力。

  qbiq由Leeor Solnik、Elad Kaminer和Noam Diamantstein联合创立,他们在软件、系统架构、机器学习、大数据、云和网络方面拥有丰富经验,也在营销,商务等方面有所建树。

  Gizmo是一家利用游戏化测验来吸引学习者的生成式人工智能学习初创公司。他们的目标是用生成式AI帮助人们以有趣的方式增强学习时的记忆。

  例如,它可以从PDF、PPT、网页甚至视频中提取信息,并做成带有测试题目的学习卡片。个性化的学习卡片能够在一定程度上帮助人们增强记忆。它也可以用排行榜或签到等方式提高人们的学习参与度。

  目前它的订阅费用是8.80美元或每年52.80美元。已拥有30万名用户,目前月环比增长50%。

  人工智能程序研发企业KudoAI获得98000美元的早期融资,金额不多,但投资者名单豪华,他们包括微软、OpenAI和GitHub。

  尽管生成式AI降低了编程的门槛,但是基于AI的自由开发仍旧没办法做到,KudoAI致力于让更广泛的人群使用高级AI。它的旗舰产品chatgpt.js是一个广受好评的JavaScript库,该库使研发人员能够在从聊天机器人到创意内容生成的各种应用程序中利用AI的潜力。

  KudoAI由Adam Lui在2023年2月创立,他是社会化媒体technodon的创始人,在LLM模型和AI领域有丰富的开发经验。

  Paxton AI利用生成式AI的能力帮企业解决法律的合规问题,它在工作过程中会不断扫描政府网站、官方公报和法律数据库等大量来源,以检测和识别任何新的监管变化或更新。

  Paxton AI提供有关新法规怎么样影响特定部门或业务的具体见解,生成根据特定客户的真实需求定制的报告。在用户向Paxton AI提出查询时,其响应是结合实际法律文本和既定判例法生成的,从而确保准确性和相关性。

  Genus AI是一款为D2C和电商品牌设计的生成式AI平台。它能生成产品目录图像、种子受众、文案和视频,帮助品牌在Facebook、Instagram、TikTok、Pinterest等社交渠道上高效增长。全球领先品牌已经在使用该平台,仅在2023年它就生成了1000万个产品图像。

  本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。