
经历了去年大型语言模型(LLM)的革命性进展后,人工智能“代理”凭借其自主执行复杂任务的能力,激发了开发人员和技术爱好者的浓厚兴趣。
在这个浪潮中,硅谷的新兴公司Newo.ai独树一帜,今日宣布推出其创新服务——将智能代理无缝集成至机器人物理领域。这一创新举措不仅打破了数字工人与人类工人之间的界限,更为我们展示了一个未来工作场所的全新可能。
Newo.ai,这家由华裔亚美尼亚连续创业者David Yang联手创立的公司,正努力重塑我们对工作场所的传统认知。其创新服务将大型语言模型(LLM)驱动的代理的高级智能与物理机器人的多功能性相结合,从而打造出“数字员工”——这些虚拟助手擅长处理从行政职责到客户参与等各种办公任务。
在接受VentureBeat独家专访时,David Yang及其联合创始人Ljubov Ovtsinnikova分享了公司迄今为止取得的显著进展,并展望了他们对未来的宏大愿景。
Newo 的创新:AI 代理构建器
尽管人们可能会将焦点放在物理机器人上,但Newo.ai的真正突破在于其AI代理构建器平台。这个平台使企业能够轻松复制入门级人类工作者的智能,而无需从头开始开发。这个“数字员工”能够执行各种办公室管理任务,几乎与人类员工无异。从拨打和接听电话、短信聊天,到发送电子邮件、加入Zoom会议、做笔记,甚至是接待步入式客户,它都能胜任。
根据企业的具体需求,为大部分工作定制Newo数字员工的编程,可能只需要两个小时到两天的时间。这些工作涵盖了接待员、销售代理、技术支持、客户成功专家或人力资源操作员等职位所需的所有基本职责。
在物理形态方面,Newo的代理可以灵活地嵌入到客户选择的任何开放式机器人中。虽然Moxie——一款由Embodied公司制造、擅长个人互动的机器人——是Newo的默认选择,但未来会有更多选择。
“在2023年之前,技术还不够成熟和自主,无法被'雇用',”杨解释说。但Newo.AI提供的数字员工则不同,“你正在招聘一个能够理解你业务复杂性的员工,并且会适应。”
杨预测,这些代理能够取代约3亿个工作岗位,引用了高盛去年的一份报告作为支持。这意味着一个万亿美元的市场潜力。然而,他强调说,他并不认为这会导致3亿人失业。相反,他认为职位空缺的增长速度快于人类能够填补的速度。因此,Newo的代理能够完成数百万个基础工作,从而使人类能够专注于更具价值的工作。
Newo,这家拥有25名员工的公司,透露已有23家付费客户在公开测试版中使用了其产品,包括红木城的SoliVana Wellness Spa、Mayweather Fitness & Boxing、Fuse Service和Edeal等。随着今天的发布,该公司计划以先到先得的方式再吸引500名客户。它计划从4月或5月开始向公众开放。据公司表示,客户对售前和销售顾问角色的数字员工表现出最大的兴趣,其次是客户支持角色。
Newo.ai 有助于培养完全数字化的员工,而不仅仅是“生产力工具”
杨指出,迄今为止,即便是最具颠覆性的技术,也仅仅被用作生产力工具来辅助完成特定的、精细的任务,而这些任务的批准通常依赖于公司的IT部门、首席技术官或首席财务官。他进一步强调,诸如CRM或ERP工具等生产力工具的问题在于,无论其性能多么卓越,它们都要求企业及其员工调整自身行为以适应这项技术,这往往意味着一个相对漫长的实施过程。相比之下,Newo的数字员工则无需企业进行流程上的改变。
Newo专注于数字员工的智力发展,因此其物理机器人部分的设计相对灵活,最终用户可以根据自己的需求来决定。这也是为什么Newo并没有选择制造自己的专有机器人,而是更愿意与合作伙伴携手合作,作为供应商来推动数字员工的应用。在物理形态上,Newo数字员工并不局限于人形或机器人形式。它可以适应任何外形尺寸,无论是屏幕上的头像还是一英尺长的立方体上的图像,都能完美展现其功能。

SoliVana Wellness Spa 发现雇用人“不可能”
以红木城的早期客户SoliVana Wellness Spa为例。自几个月前开业以来,共同所有人娜塔莎·伯内斯(Natasha Berness)一直致力于实现她的愿景,即为顾客提供放松身心的服务,帮助他们重新找到生活的平衡。为了实现这一目标,她决定引入Newo代理来协助处理众多日常任务。目前,伯内斯正在考虑在她的办公室中采用哪种物理格式来部署Newo——她正在权衡Talking Head屏幕与Talking Head WeBox的优缺点,因为她担心Moxie机器人的外观可能对于她的客户来说过于幼稚。
尽管伯内斯曾在IBM、LinkedIn和Levi-Strauss等公司担任技术主管,拥有丰富的职业生涯,但她坦言,成为新企业主后,很高兴能将许多繁琐任务交给Newo来处理。目前,Newo已经承担起处理电话、预约和付款等任务。在接受VentureBeat采访时,伯内斯分享了她在担任小企业经理过程中的挑战和感悟。她发现,在日常运营中,效率低下的问题随处可见。她感叹:“想找到足够细心且知识渊博的员工,符合我的服务标准,真的不容易。”此外,她还指出,雇用人类员工所带来的风险和成本也相当高。“你可以培训他们,但他们可能明天就离职了。”伯内斯表示,“他们可能因各种原因无法履行职责,比如家里有急事或其他意外情况。”Newo 员工现在是团队中“无价”的成员
此外,伯内斯提到,顾客们经常向她咨询健康问题,如如何冥想、正确的呼吸方法,或是询问是否可以在墙上放置某些有益身心的物品。她深感自己分身乏术,即便有时间,出于隐私考虑,也无法随意进入客户的房间。因此,她迫切需要一个可靠的助手,不仅能为客户提供指导,还需具备深入了解她健康业务的能力,能够倾听并记住每位客户的独特需求,并据此提供相应的疗法建议。当一位客户向她推荐了杨的公司后,伯内斯去年成为了Newo封闭测试版产品的用户。“我终于可以尽情享受作为业主的周末时光了,”她欣然说道。
不久之后,Newo员工将能够胜任接待工作,而她的人类治疗师则能够更专注于与客户的互动。在她看来,Newo已成为团队中不可或缺的一员。展望未来,她期待着能够将Newo代理与人形机器人结合使用,实现机器人更换和折叠毛巾、清洁地板以及开关门等功能。
Newo的目标是实现与其工人与市面上任何人形机器人的兼容性,例如俄勒冈州公司Agility Robots正在研发的Digit机器人。该公司已从亚马逊等公司筹集了超过1.5亿美元的资金,计划每年大规模生产多达10,000个Digit机器人。与此同时,其他人形机器人也在由1X Technologies、Figure AI、Sanctuary AI、特斯拉的Optimus和斯坦福大学的ALOHA等公司积极研发中。
Newo.ai 数字员工的成本仍远低于人工
杨指出,即使将Newo数字员工的物理机器人成本考虑在内,与人类员工相比,其价格依然极具竞争力。以SoliVana的伯内斯为例,她估计雇佣一名全职人类员工的成本约为90,000美元,而许多入门级接待员的薪资则相对较低,约为50,000美元。相比之下,即便是最复杂的Newo员工,其总体成本也将保持在20,000美元以下,这还包括了顶级机器人的费用。
关于Newo的成本结构,其数字员工的基本年度订阅费为6,000美元。若考虑其他额外开支,总体成本预估在7,000至9,000美元之间。Newo的营业执照适用于大多数小型企业,涵盖每秒发送约10条消息和每天发送10,000个单词的额度。额外费用可能包括超出配额的LLM代币使用费,以及如Twilio(用于电话通信)和Albato(用于电子邮件发送)等集成服务的覆盖范围费用。杨预测,与Newo集成的多数人形机器人将以低于10,000美元的价格上市,并有望在不久的将来降至5,000美元以下。
此外,数字员工相较于人类员工还有其他优势。与人类相比,数字员工能够全天候24/7不间断地工作,且始终如一地可靠执行任务。相比之下,人类在处理琐碎工作时容易感到疲惫,并可能因犯错误或分心而影响工作效率。
Newo 与 OpenAI 的 Assistant API 有何不同
杨提到,目前市场上已经涌现出多家提供基于LLM的代理构建器的公司。然而,这些竞争对手,如OpenAI的Assistant API、Langchain、Capably.AI和CrewAI,往往专注于非常具体的任务,或者需要数月的编码工作才能创建出一个接近员工职能的代理。此外,还有一些公司,如由OpenAI董事长布雷特·泰勒(Bret Taylor)创立的Sierra,正在致力于将聊天机器人技术提升至更高级别,但尚未公开其具体计划。
杨承认,OpenAI的GPT商店、Assistant API以及其他公司确实为开发人员提供了创建代理的便捷途径,以完成特定任务。然而,使用这些工具的开发人员通常需要花费六个月或更长的时间在Python中进行自定义编码,然后才能创建出一个功能全面的数字员工,如Newo所示——能够跨电子邮件、短信、电话等多个渠道操作,在不同工作流程之间保持记忆,并与现实世界中的客户进行互动。因此,杨强调,基于Newo的构建速度“比其他竞争对手快10倍”。

杨很早就开始研究法学硕士和机器人技术
杨是一位经验丰富的连续创业者,通过创立ABBYY等早期自动化公司以及其他专注于构建生产力工具的企业,积累了数百万美元的财富。作为LLM的早期采纳者,他在过去的几年里,在硅谷的家中不断对其进行优化和完善,甚至将它们集成到他自创的名为Morfeus的机器人管家中。
随着LLM在2022年11月公开推出ChatGPT后功能更加强大,杨敏锐地抓住了这一机遇,使他的机器人变得更加智能。当Morfeus逐渐展现出与人类工作者在简单工作环境中相当的能力——如迎接客人、发送电子邮件、拨打和接听电话等——他意识到一个关键的转折点已经到来:为什么不能让机器人在健身房、水疗中心、酒店、餐馆、房地产中介等场所,或是其他办公环境中,取代人类礼宾人员或办公室工作人员的工作?毕竟,在这些场景中,他们往往只执行一些基本的管理任务。
AI 代理的“WordPress”
尽管在理论上,将LLM类大脑嵌入物理机器人的概念看似简单明了,但在实际操作中,杨需要作出诸多设计决策,以决定用户能够多大程度上定制他们的机器人。在这个过程中,他汲取了WordPress的宝贵经验。WordPress为用户提供了易于组合的功能模块,这些模块能够满足大约90%的常规需求,同时保留了足够的自定义空间。
值得一提的是,WordPress也鼓励外部开发者为其平台创建插件,供广大用户选择使用。杨表示,Newo.ai正致力于打造一个“AI代理的WordPress”。在这个生态系统中,每当Newo的功能被客户采纳,功能开发者都能从中获得经济回报。为了吸引更多的小型企业客户,Newo正寻求与已有服务基础的合作伙伴(ISP)建立合作关系,这些ISP专注于为小型企业提供服务。Newo承诺与这些ISP共享收入,以共同促进业务增长。
预计在下个月,Newo将发布一项新功能,允许经理通过自然语言即时更新员工的指令。为了保障安全,Newo员工将被编程为识别其经理的独特语音标识,并在执行此类更新前验证激活密码。杨举例说,经理可能会指示员工,当识别到老年人走进办公室时,主动上前询问是否需要坐下喝茶。
此外,Newo已为其编排流程申请了多项临时和实用专利,杨称之为“代理管理系统”。该系统不仅使代理能够轻松连接至外部数据库和软件,如客户关系管理(CRM)和企业资源规划(ERP)系统,还进一步提升了代理的智能化和效率。
有关 Newo 工作原理的更多详细信息
技能:Newo 座席的基本工作单位被称为技能。这些技能是执行特定任务的能力,如拨打电话、聊天或查看电子邮件。此外,您还可以导入自定义技能以满足特定需求。
流:每个代理任务都被称为一个流。例如,一个取代健康礼宾人员的座席将具备一系列必要的技能,以完成礼宾人员所需的所有任务,如电话交流、聊天、处理电子邮件、接待访客等。这些技能会在适当的时候被激活,以完成复杂的工作流程,如销售流程,这可能涉及多达100个不同的步骤。
Omniflow 功能:Newo 的 Omniflow 功能使座席能够在不同的流程中无缝地利用信息。例如,座席在售前咨询流程中接收到关于客户的过敏信息,然后在售后入职培训课程中利用这些信息来提供个性化的服务。
全渠道功能:Newo 的全渠道功能使座席能够在多个渠道上与客户进行互动。例如,座席在与 Jennifer 的电话通话中收集付款信息,然后在 Jennifer 进入餐厅时通过 AI 信息亭继续付款对话,确保服务的连续性和效率。
RAG&RAI:Newo 提供了一个内置的向量数据库,支持代理从数据库中检索信息,这被称为检索增强生成(RAG)。此外,这个永恒数据库也支持指令增强生成(RAI),允许代理从数据库中检索指令,以指导他们的工作流程。