推广 热搜: csgo  vue  angelababy  2023  gps  新车  htc  落地  app  p2p 

大模型的场景落地,印象笔记这次跑在了第一线

   2023-06-07 网络整理佚名2750
核心提示:这意味着他们不仅仅是一个笔记软件,而是一个能够理解、协助和增强用户思维能力的工具。通用大模型不会一统天下是这个意思,而印象笔记的外脑服务一定是有能力基于用户个人数据,个人知识和认知的。或者其他通用模型也好,现在都不是在用用户个人的数据对它进行训练,只是让它作为一个分析机器对数据进行分析。印象笔记的产品壁垒是用户积累和存储的信息。印象笔记的智能写作主要是菜单式的交互。

模型落地的场景,印象笔记这次跑在了第一线。

今年3月,印象笔记公布了自主研发的轻量级大型语言模型“大象GPT”,并率先推出“印象AI”。 多场景智能服务。

正如印象笔记CEO在接受采访时所说:“我们相信,通过自主研发和创新,我们可以为用户提供更加个性化和高效的服务。”

自其前身以来,一直秉持着做人类“第二大脑”的初衷。 2018年,印象笔记及其独立分拆后,印象研究院成立,正式研究NLP。 这意味着它们不仅仅是一个笔记软件,而是一个理解、辅助和提升用户思维能力的工具。 让用户更高效地管理和利用自己的知识,是做笔记工具的初衷,也是印象笔记能够快速推出自家大机型的原因。 这背后,离不开前期以来的用户认知和用户数据的积累。

关于“大象GPT”和“印象AI”的起源与未来,极客公园创始人兼总裁张鹏与印象笔记CEO唐毅进行了对话。 唐毅谈到了 如何在语言理解和处理上不断创新,以及在当前的 GPT 趋势下,如何发现专有模型在通用模型之外的更大市场的潜力和未来。

01 通用大模型不会一统天下

张鹏:

你之前提到(印象笔记)做NLP(自然语言处理)已经很久了,那么你是什么时候开始把AI路径转为GPT的? 为什么要自己做大模型?

唐毅:

从NLP逻辑来看,外脑必须能够处理自然语言在知识方面的能力,尤其是逻辑,所以我们需要对自然语言有清晰的认识,这也是真正GPT的能力。 无论是通用的还是特殊的大模型,都具有分析、提取、汇总、智能书写的能力。

通用模型的基本逻辑是,大家共享一个参数非常大,规模上千亿的模型。 它的基本逻辑已经用很多不同的语料库和数据进行了训练,形成了一个推理/预测机器。 但是作为大脑,它是一个通用的大脑,每个人都用同一个大脑进行交流。 用户的个人数据或者个人知识还没有能够训练大脑,即使跟它交流,甚至让它分析一些个性化的知识,也不会影响大脑的思维过程。

所以从用户的角度来说,通用模型很强很通用,但是它绝对没有个人特征,不会对自己的知识、对世界的认知、积累的信息有任何形式的反应。 而且还有一个问题,就是通用语料和特殊语料真的不一样。 个人用户积累的、独特的,或者团队、企业积累的、独特的,必须用专门的模型来呈现。

张鹏:

如果有这样一个工具,可以结合我过去的知识库,把过去创建的概念和现在的概念整合起来,形成一个完整的内容,我会很高兴。 但是,通用的大模型目前可能做不到这一点,因为它不理解我十年前积累的脉络和知识。

唐毅:

就是这个意思,印象笔记的外脑服务必须能够基于用户的个人数据、个人知识和认知。 任何通用的大型模型都有局限性,包括 GPT-4。 它们都有语料库更新和范围限制。

张鹏:

外脑就是说它不仅可以给你存储,还可以调用它。

唐毅:

没错,笔记是线索,用来提示索引、记忆知识、记忆本身,但并不是所有的知识和记忆都完全存在于笔记中。 外部大脑的概念需要全面的数据收集来支持。 未来的个人大模型是部署在云端还是部署在设备上,这是一个选择的问题。

在这个领域,有很多前沿的研究方向。 我们不固定在某个方向,我们的智能硬件是基于听、说、写等功能的。 所有函数都是输入或输出。 比如我们有智能录音、智能扫描、智能书写、墨屏,你可以写,也可以分享。

随着我们自己的大模型的不断推演,甚至在大象GPT和印象AI全面推出之前,我们就清楚地看到一个需求,无论是用户、企业还是产品,处理内存和个人信息的需求都趋于持续记录和维持记忆。

有一点很明确,正如我们刚才所说,算力和算法越来越像基础设施,而数据也越来越重要。 形成个人的知识体系,实现外脑的概念,确实需要知识和记忆的不断储存,这个方向是明确的。

张鹏:

那么印象AI可以算作一个垂直模型吗? 怎么定义呢?

唐毅:

我觉得在数据上也算是垂直的。

垂直领域是大模型、AI方向的称呼,所以这里指的是某个领域,可以是某个垂直行业的领域,也可以是某种数据形式。

我们有两种逻辑,一种是用户自己的数据或者企业自己的数据,或者印象团队管理的自己的数据。 另一个是比较严肃的知识。 我们模型的训练会更​​加注重知识,趋向于对知识的更深入的理解和不同领域知识的联系。 那么在模型能力上逻辑上可能还不如通用大模型。

张鹏:

所以可以说,即使是通用的大模型对接了API,也解决不了你产品场景中用户真正的问题? 这就是你们必须自己做大模型的原因吗?

唐毅:

这是原因之一。 有几个更深层次的原因。

第一点,我们很早就有世界观去研究NLP,在大模型上有几年的经验。 在这个过程中,我们的理解是,未来的世界绝对不是几个通用大模型的世界,而是不同形态模型的世界。 这些模型可能是不同的通用大型模型,也可能是很多垂直领域的中小型模型。

此外,我们和我们的许多同事认为,生成式人工智能和大型模型是工业革命级别的技术事件。 在此前提下,我们判断未来会出现不同形态、不同通用和专用能力、不同部署特点的模型,服务于不同人群、不同行业的不同企业。

第二点,无论是大象GPT还是其他通用模型,都不是利用用户的个人数据来训练它,只是作为分析机来分析数据。

我们希望未来无论提供团队模型还是私有模型,用户都可以选择使用我们的模型基础来训练和调优他们的数据,让训练出来的模型完全是个人模型。

张鹏:

看到直播间有观众提问。 最近碰巧大公司做大模型,开源社区做小模型。 未来国产大车型的发展会不会如此?

我还看到国内至少有100个大型号,这些的核心都能称得上通用?

唐毅:

我觉得说这句话是有一个背景的,就是大模型的安全性。 有语料库训练,如何监督模型的新兴能力,如何更好地服务用户。

还有一点就是开源社区和开源模型对大模型的开发提供了很大的帮助和帮助。 开源开发者给大模型的技术能力和整个产品行业的发展带来了很多可能性。 这是一个由巨大的大型模型能力驱动的方向。

第三点,所谓小模型,本质上就是大模型。 参数有的是几百亿,有的是几千亿。 都是大款,没有小款。 这些不同的大模型为技术发展带来了繁荣的生态。

第四点我想说的是,我不认为一个行业总有尘埃落定的时候,但相对来说,一个新技术会逐渐找到一个主流方向和一个相对稳定的产业生态。

张鹏:

如果有大模型,性能提升,通用,别人做的大模型就没用了吗? 如何面对这种焦虑?

唐毅:

在趋势方面,有一个非常明确的方向。 我们,包括很多其他同事,都会把这看作是电力和互联网刚刚发明的时代。

生成式人工智能的产业发展,依然会沿着这些新生事物过去的发展曲线。 快速上升的过程中可能会出现一些泡沫,但泡沫会逐渐被挤出,真正的东西会出来,最终形成这一代的技术前沿。

在这个方向上,我们必须不断地仔细思考两件事。 一是说,以非常开放的心态,最前沿的可能性在哪里? 还有一点,它的底层逻辑在哪里? 或者我们如何看待大语言模型?

但是,我们认为前沿问题有完全不同的可能性。 这种可能性并不意味着新的平台制造商和大型模型制造商会立即出现。 比较可能的方向是大机型加插件,APP+专用机型。 这两个方向,我认为比较专用的场景模型和通用大模型提供的私有信息和服务,以及各厂商对大语言模型提供的有限或更多的服务,通过插件开放自己的信息, 都具有很强的含义。

这两种服务都有可能催生真正改变日常生活、工作和生产力的公司。 未来,每个人需要的是一个符合自己思维个性的私人助理。 世界上帮助每个人思考的大脑绝对不是只有几个,而是不同的机器大脑帮助不同的人思考。

张鹏:

AI 如何避免事实性错误?

唐毅:

两种类型的方法。 一种是知识图谱,结合GPT进行一些事实判断。 另一种是通过不同的接口和API调用进行实时上网和实时分析。

02多脑服务一人

张鹏:

你提到有些人期待把笔记和写作结合起来,这样会更方便。 有些人认为在笔记应用程序中添加书写功能很奇怪,但其他人表示支持并希望两者结合。 你怎么看这个问题?

唐毅:

我们现在训练生成式 AI 来学习真正的写作。 在知识管理和协作场景上的表现基本上是2种表现。

第一种呈现方式是对话形式,比如微软的。 这个形态先是从,然后到Edge,再到365,最新的是直接到,已经是AI原生操作系统了。

它的交互形式更多的是直接对话的形式,包括公开对话或多轮对话。 这也是因为大模型的一个强逻辑:in( )。

另一种形式体现在这种下一代知识管理平台的产品上。 它根本没有对话模式,而是纯写作助手模式。 基本上它是一个菜单逻辑。 我们对这两种形式的判断是,它们并不矛盾。

其实第一个是LUI( User ),第二个是GUI(Menu User )。 两者都有混合逻辑。

张鹏:

微软称其为AI助手,你如何定位这种辅助写作的能力? 如何设置它的含义?

唐毅:

未来有意义的智能写作越来越不是通才可以完成的任务。 它必须由专家根据其能力和用户的个人资料完成。

第一个角度是动作的速度。 这种快速来自于我们积累的经验。 按理说,在引入GPT模型之前,我们已经推出了各种模型,所以反应速度肯定非常快。 此外,除了现有的写作助手功能外,用户很快就能规划文档、与多个文档进行对话,并开始与整个记忆数据(如笔记和以前写的文章)进行交互。 随后,可能会有进一步的迭代。

第二点是关于模型能力。 我们相信在推动行业和行业的过程中,大家可以逐渐看出服务于通用场景的通用模型和服务于特殊场景的特殊模型的区别。 即便都是写作助手,因为我们的模型和我们一直服务的用户都是专注于特定场景的,所以我们积累的语料库也专注于知识管理和知识生产力提升等领域。

第三点是用户对我们的信任和使用。 我们深感荣幸能够受到中国乃至全球众多用户的喜爱。 已经存在了十多年。 在此期间,用户在我们的平台上存储了大量的个人信息、知识信息、生产力信息、学习、工作和生活信息。 即使用户选择不自己训练模型,他们仍然让我们的模型处理信息。

我刚才提到了一个观点,数据在逻辑上越来越重要和有价值,无论是特殊数据还是专业领域的数据。 我们一直是本地外部大脑的制造商,提供不同的技术,并随着技术的发展为每个人提供更好的用户界面。 因此,我们非常有信心我们的产品能力和技术能力将继续领先。

张鹏:

很多AI产品都具备辅助写作的能力。 如何定义助写功能? 您对如何使用大型模型来形成用户体验障碍有何看法? 如何思考产品如何为用户带来价值?

唐毅:

我们认为最重要的是思考问题,而不是如何建立壁垒。 也就是说,先想一想自己要做什么,服务什么,做好了,再提高自己的能力,再想一想自己的眼光,障碍就会逐渐出现。

印象笔记的产品壁垒是用户积累和存储的信息。 因为用户对品牌的喜爱、认可和使用积累了一些东西,逐渐形成了壁垒。

说到真正的障碍,或者说优势,我们觉得有三点,第一点是模型/AI能力本身,第二点是部署本身,第三点是环境/交互,尤其是我们的场景——相关的互动。 一些理解。

首先,我们的一个特殊逻辑是不同模型的可能性。 也就是说,在这个特定场景下,我们专注于积累语料库、训练经验,致力于提供知识管理、写作、知识生产等领域的专业化服务。 针对这种场景的需求,我们的模型具备了一定的能力,无论是模型容量和调参能力,还是模型承受多次迭代的能力,以及进行索引和多次迭代的能力在应用层的计算,甚至在我们的提示工程能力方面,我们已经积累了相当多的时间。

从模型部署的角度来说,大家不仅要考虑个人的需求,还要考虑企业的需求,甚至是一些政府场景的需求。 然后它真正需要的模型必须部署在防火墙后面。 对于这个模型,我们考虑的不仅仅是它训练的语料库,而且要处理和分析的信息必须足够安全。 因此,无论是私有部署、混合部署、通用模型还是私有模型,针对不同场景的模型都是未来的发展方向。

在交互方面,我们认为有两种可能,一种是菜单式交互,一种是开放式交互。 开放式是纯对话,允许一些不太适合菜单的交互。 印象笔记的智能书写主要是菜单式交互。 未来我们会引入类似的开放式对话,实现开放式互动。 这种交互逻辑类似于 的逻辑。 在这一点上,经典互联网的产品能力、交互设计能力和思维还是很有用的,因为不是所有的场景都只能用LUI,而是LUI和GUI的分界点。 什么时候选择哪种方法,需要根据经验和积累来做决定。

张鹏:

是的,简单的LUI/对话框并不能解决所有问题,那么哪些关键环节需要GUI来及时提升用户交互的效率和体验呢?

唐毅:

过去GUI优于LUI的原因之一是背后技术能力的差距。 比如智能音箱等传统技术驱动的LUI并不靠谱,所以以往交互体验中LUI的选择就远远落后于GUI。

打开LUI的逻辑和选择菜单GUI的逻辑其实在不同的场景、不同的心理状态下有着完全不同的边界和适用性。 这是我们不断实践、不断思考的结果。

大模型最重要的能力是逻辑能力和进行多轮交互的能力。 既然是处理语言,那么到现在为止,输入输出最好的呈现还是语言。 所以,在未来,LUI肯定会占据更多的股份。

但还是有一些人喜欢单反相机用户,喜欢在提供的选项中进行选择,喜欢自己控制。 从这部分用户需求来说,GUI肯定是会存在的。 但是LUI肯定会占到更多的份额,因为LUI仍然是目前为止最符合大模型技术逻辑的输入输出方式。

对于技术、产品以及技术通过产品向个人、企业、团队和每个人提供服务的方式,交互将继续成为一个持续重要的领域。 但是,领域本身的边界和内涵会发生变化,变得更加丰富。

张鹏:

换句话说,以前的UI的核心是把所有的工具都放好,方便用户调用。 未来 UI 的使命是在正确的时间出现,以确保用户更好地利用他们的能力。 LUI是一个新的范式,但光靠它还不够,还需要别的东西,还有很多问题需要继续思考。

未来会不会有新的 产品整合? 它会成为一个全新的事物吗? 比如ToB的可能性。 因为感觉很多生产力级别的工具很快就会变成ToB。 而ToB直接有很强的付费意愿。

唐毅:

在ToB方面,很多公司已经在和我们对接了。

就交互而言,未来肯定会有更多适合LUI的设备。 在这种设备的反向驱动下,应用厂商的选择必然会导致不同的交互选择和产品方向的选择。

张鹏:

大模型之所以令人兴奋,是因为它是范式革命,产品有机会重塑。 不像原来的补丁更新,这个感觉完全不一样。

唐毅:

是的,这是生产力根本变化的一场革命。 之所以激动,是因为你会发现,确实有很多东西只能重建和再造。

张鹏:

既然你有这么多的用户,你有没有想过这个产品未来的张力? 比如私人助理,因为你已经有了外脑的概念。

唐毅:

当谈到私人助理的界限以及他们在个人生活和行业中的作用时,我认为有两个警告。 首先,我们要认识到,现在的大模型的交互,无论是用什么软件、平台跟它通信,或者让它处理任务,都是同一个模型,不属于个体模型, 并且不通过用户数据进行。 训练或优化。 无论是通过单提示工程的方法,还是以向量数据库的形式进行索引,都是一种脑思维。 但显然,全球共享大脑是不现实的。

第二点,一个大脑为一个人服务存在一些问题,因为一个人在不同的场景下有不同的需求。 例如,工作用脑、活用脑,甚至可能是游戏用脑。

关于部署,除了镜像上的部署,还有一个非常技术性的部署问题,就是我愿意把一些脑子放在云端,也只能放心一些脑子在设备上。

因此,在选择AI助手或AI助手的发展方向时,我们确实认为更个性化、更场景化是未来的趋势。 它既不是一个大脑为许多人服务,也不是一个大脑为一个人服务,而是许多大脑为一个人服务。

此外,这些大脑,包括印象笔记的知识大脑和第二大脑的外脑思维,在工业和生产生活中将变得更加重要。 它的重要性源于大脑的思考能力。 它可以替代现有的一些平台级应用或信息聚合应用,为用户提供最好的服务、内容、产品、知识、协作和社交。

现阶段大家会聚集在流量分发平台上。 未来,我相信每个人的多颗大脑都会根据个人的需求,在各种场景下进行流量的连接和分配。

张鹏:

就像现在不同的产品一样,用户在使用过程中与它们建立了不同的联系()。

唐毅:

是的,个人助理在不同方面起到了不同的辅助作用,但是这个助理有一个特点,就是大模型有所谓“ in ”(in )的能力,也可以叫做“思维链”或“记忆链”。 当你和助手交互的时候,它能理解上下文,它展现了这种能力,这是大模型训练过程的一个特点。 然而,更重要的上下文是一个人、一个系统或一个产品了解用户在过去十几年里写了什么。

张鹏:

在我看来,我们应该从关系的角度来看待未来助理的状态。 为什么我说助理不会是全能助理呢?

因为这种关系不符合人的需要,人际关系是多层次的,你有用户,有同事,有朋友,甚至有酒友等等。 在不同的领域,你的关系是分层的。 所以不可能用一个模型解决所有的问题。

唐毅:

在某些情况下,上下文是不必要的。 例如,在与酒友和高尔夫球友互动时,知识和工作背景并不重要。 但是,在与同事、学习伙伴、同学交流时,语境很重要,包括你过去积累的知识。

03 软件的未来:泛API

张鹏:

未来软件有什么价值吗? 所有的软件都会变成API吗? 如何重新认识这个时代的软件?

唐毅:

我觉得现在有一个重塑软件行业的机会,会增加软件的可能性,印证过去的一些软件趋势。

从我们的角度来看,软件具有广泛的含义。 在过去的几十年里,软件行业涵盖了从基础设施、云架构、开发工具、服务到应用层的方方面面。

大模型及其带来的处理能力、思维能力、思考能力和在生态系统中的作用,以及不同的计算能力、算法和数据的方法(如从头训练、开源和调参)以及与厂商的合作。大语言模型将改变整个软件行业的形态和格局。 我个人认为这种变化有两三个明显的趋势。

第一个趋势是新平台应用的可能性。 以后本脑会收集或者帮你分发推荐。

第二点泛API和插件化是一个非常明显的趋势。 在软件与软件的交互中,API扮演着重要的角色。 API 在应用程序与应用程序之间的交互和对话方面变得越来越重要。

第三点,在重塑生态的过程中,我们的判断还是要回归初衷。 在重塑整个技术栈和应用栈,包括新大模型技术栈,重新思考从底层芯片计算到应用层的技术栈的过程中,我们要始终以用户为中心,需要从根本上从用户和用户体验出发去思考。

张鹏:

综上所述,做软件的人在目标上需要更加负责,即解决用户的问题。 未来软件需要更多的连接,形成用户社区。 虽然很难达到“一气呵成”的目的。

在未来的形式中,以前的策略可能行不通。 未来涉及很多细分领域和场景,能否在每个领域发挥最好的作用是关键。 用户可能需要调用彼此不同的软件,并在不同的部分选择最佳的解决方案。

04 不要假装你已经想通了

张鹏:

为什么决定推出“大象GPT”和“印象AI”的产品并以如此快的速度变现? 之前谈过,一直以“第二大脑”为目标。 这个目标是如何出现的?

唐毅:

在独立之前很久就与生成式人工智能相关联。

最早的创始人将这家公司定义为大脑( brain)。 那时候,老人已经有点帕金森症了,所以创作的初衷之一就是帮助他记住和回忆他可能已经忘记的事情。 公司的愿景是成为人类个人团队和企业的第二大脑,即“外脑”。 ”。

这一愿景一直延伸到公司的整个发展过程中。 在生成式人工智能和自然语言处理出现之前,印象笔记可以非常快速地处理不同形式的数据,帮助用户记录并永久记住内容。 之前是通过搜索来实现的,这个问题是从关键词和算法的匹配上解决的。

本土化之后,我们成立了印象研究所。 在 is all you need paper之前,我们试图通过非GPT形式在不同的专业场景下进行自然语言处理和自然语言理解。

研究院的目标很明确,就是如何为个人、团队和企业提供“外脑”服务。 这项服务背后最重要的智能是自然语言理解和处理。

2021年前后,我们将有自动标注、智能标签、智能摘要等功能,帮助用户连接他们的知识。 我们的大象GPT之所以能够发布的这么快,也是基于我们多年的研究和经验。

当前产品的背后是驱动程序。 用户可以通过不同的产品从前端感受到这种冲击,包括AI服务、一系列智能生成、智能写作、智能摘要功能。

产品背后是印象笔记研发多年的轻量级单元模型,即大象GPT。 一般来说,所有的AI功能都是由大象GPT运行的。 驱动印象AI的写作助手、智能生成、智能文件分析等功能。

张鹏:

你们在3月份快速提升GPT的时候,有没有用OKR或者KPI来管理内部事务? 作为CEO,如何带领大家形成共识?

唐毅:

在目标管理和战略管理方面,我总结了几点。

首先,长期的战略方向是必要的,但短期的调整也是必不可少的。 要明确大方向,不断调整。 这个清晰的过程可能需要更长的时间,我们需要思考一下我们的初衷和追求是什么。

另外,作为管理者,我不赞成只考虑短期的事情,因为外部形势变化很大。 之所以在市场上取得了一定的实战成果,不是因为我们只是在短期内想通了,也不是因为的出现让我们想通了。 相反,我们追求自然语言处理(NLP),追求通过语言为知识服务,通过知识服务为人类服务。

从这个逻辑来看,我们一直坚持初心,我们的方向是顺应大势的。 当这种趋势出现时,就是一个机会。 So, there is a logic to all of this. 这是第一点。

The point, I would like to share the .

Our 's is a of and local , on and . We every to be brave to admit their own , not to that they have it out, but to to the of .

At the same time, in terms of , we have made . The of code in has been times that of the code . , is very . We need to have , but we also need to have the to think and .

Under this , I think KPI and OKR are , they are not a , each has its own and and , we need to and , while and to make sense.

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报
Powered By DESTOON