新闻动态

他使用RL作为代理商毕业于斯坦福大学，中国企业

作者:bet356体育官方网站 时间:2025/07/11 点击:

机器创建者的原始心脏：Youlipokee AI公共Beta版已正式推出！ “你好，你能听吗？”北京时代的10点，Pors Eye的创始人Zhu Zheqing在大海的另一侧，我们的电话回答。它目前位于美国西海岸，是当地时间晚上7点。前一天。用他的话来说，我最近的状况是“忙”，非常忙。他通过推出特工Pokee AI的产品的公共Beta版本来占用，该版本涉及从第一轮筹款活动开始的几个监视问题，将中央团队从四个人“扩展”到七个人，从繁忙的Zheqing中休息一下，在繁忙的计划中，LLM在越来越多，主要是在计算互动互动的互动界面上，并以实时的方式来理解用户的互动界面。 TareatoDas决策和执行是根据RL结构完成的。但这是去年10月，但歌剧没有推出O1，PushEd RL向公众和DeepSeek并没有引起全球狂欢节。当他们与大多数投资者交谈时，每个人都认为Pokee的指示是幻想...现在逐渐从“共识”变成“共识”，而Pokee.ai也进入了新阶段。最新新闻Pokee.ai已完成了由Point72 Ventures执导的1200万美元种子的资金，而Pokee AI Public Beta现在现在在线。本周，“机器的心脏”与Zhu Zheqing对抗Pucky Beta的官方进行了交谈。以下是一场对话：机器的心脏：pokee.ai于去年10月成立。目前，该产品正式使用Beta，并完成了种子轮的财务状况。这种节奏取决于您，您期望吗？ Zhu Zheqing：一般节奏相对较快。 Pokee.ai于去年10月成立。自概念概念，一般代理框架的构建以及现在宣布该产品的公共beta和资金以来，只有七个多月过去了。目标建立上面的ISHED将完成产品第一轮的公共Beta版本的上半年，并获得种子轮的融资。现在已经完成了，但这通常与期望一致。与目标相比，节奏的速度约为4-5倍。对我来说，生活和工作的节奏并没有太大变化。我什至有时间思考。我在工作时同时赢得了博士学位。那时我很忙。我可能每周工作超过100个小时。我现在还有100多个小时，但是我有更多时间考虑一下。从机器开始的思想：实际上，很少有人会做您的工作。投资者认为他们做的最常见的问题是什么？ Zhu Zheqing：当我开始与投资者聊天时，我的普遍感觉是他们不明白为什么他们想成为一个与他人不同的代理商。当时，RLNO很受欢迎，DeepSeek从未出现过。当我第一次说我们想做的是转动SOM的RL系统像典型的操作系统一样，他们都认为这是幻想。机器核心：说到执行AI代理的最初意图，一旦他说Pokee.ai“不是完成人类等任务，而是要克服某些任务中的人类战略选举和计划能力。”这是一个如此流行的概念吗？ Zhu Zheqing：我认为ASIS和AGIS的定义范围真的很模糊。从某种意义上说，它可能已经实施了。鉴于100万个令牌的文章，Humano需要很长时间才能阅读它，并且该模型仅需几秒钟甚至几十秒即可完成它。从这个角度来看，这是一个超人的情报。您距离“ chatgpt”代理有多远？机器的心脏：您认为，普通代理应该具有什么特征？ Zhu Zheqing：公共代理人的中心功能，无论哪种情况，无论问题是什么，都只需指示警告并允许您完成TASk无需配置要提前使用的工具。我们的想法是客户正在煽动我，并说这是我想做的。公司或开发人员不必处理这一点，即直接向Porky发出通知。 Pokee遵循说明，以调用相应的工具，解决问题并将结果直接传递给公司或开发人员。后者为内容提供了更好的演示表格，并且可以使您再次养活客户。机器的心脏：可以将其理解为AI代理商的“聊天时刻”吗？您目前是哪个阶段？ Zhu Zheqing：是的，这是完全不必要的，必须人为配置的AI的代理也是我们的最终想法。当前的AI代理需要大量配置（工具），并且需要匹配MCP服务器以找到该工具。但是，在通知中可以添加的工具很少，所以我相信我会被迫进行一般培训的一般数量，因为它不能成为广告ded。机器的心脏：然后，当我开始生意时，我看到了这些限制。 pokee.ai是如何的？ Zhu Zheqing：我们想做的是允许第三方开发人员完成开发的AI代理的一种方法，无论是代码，低代码还是低代码。没有代码。这意味着Qeu Pokee直接执行通知，并在获得工作流程后，将其复制并粘贴到无数情况下。低代码意味着通过其他人想通过界面以指示形式解决的问题，从而解决问题而不告诉他们要使用哪些工具。机器的心脏：具有RL为原子核的AI药物与LLM作为核的AI剂之间有什么区别？ Zhu Zheqing：首先，许多LLM当前使用增强学习和工具范围的范围，要求使用加固学习模型，我们与传统LLM模型的工具范围不同。具体而言，差异是行动空间。换句话说，TH的动作空间E LLM模型仅是令牌，但是增强学习模型的动作空间不是文件，而是直接通过GeneralTool Isization完成AI代理的构造的工具。机器的心脏：在对代理的典型描述中，这些适应症非常严格，但并非全部提出问题。您如何看待这种现象？ Zhu Zheqing：是的，用户在使用Pokee时也会遇到此问题。他们已经在给您一些快速的东西，但是我为什么不想要您写的东西呢？关键是用户给出的指示不是他们的真实意图，而是他们想做的事情以及他们所说的可能会有所不同。理解意图的方式称为对齐。这是非常困难的。因为没有真理，每个人的讲话都不同。如果您真的想找到土地的真相，如果您说用户必须提到这个问题，他将不得不写关于该人的长期笔记，以便能够找到他与我的我联系流行。通过确定如何前往此路线，您必须首先能够解决问题，在没有用户培训的情况下自定义数据，Buyenderlos并调整它们。可能有三个步骤：制定能力，内存和对齐定制。机器Zhixin：您能给我们一个例子吗？ Zhu Zheqing：例如，当投资者测试我们的产品时，他写了一个通知，他可以帮助我写一个LinkedIn帖子吗？那么，这个“草稿”是否表示“不仅为我写作，不要发送它”或“为我写并直接发送”？要了解您的真实意图，您必须看到对以前的员工或同事说这句话的话，并通过他们的互动来了解“草稿”的含义。这非常复杂，需要一个非常个性化的内存才能完成。机器的心脏：那么当前的步骤在哪里？ Zhu Zheqing：整个行业的第一步尚未完成。更不用说第二或第三步（哈哈哈）。机器的心：据此我应该怎么办？ Zhu Zheqing：我认为这是Viewa非常重要的未来的看法，但是从商业角度来看，这不是优先事项。首先要关注的是是否可以解决问题。首先，解决问题，然后寻求更好的理解（问题）。机器的心脏：Porky的体系结构用作交互式的人类计算机接口，类似于“用户界面层”作为交互式的人类计算机接口，以了解用户的意图，并且可以理解，所有真实决策和执行任务都是根据加强学习结构完成的。根据这种理解，您真的对指示有很高的要求吗？ Zhu Zheqing：是的，这要复杂得多，所以我一直说LLM越好，越好。我将RL代替LLM作为AI代理的核心，但是我在这里与LLMNO冲突。如果纯语言的方向没有改善，也有一个瓶颈d不能逐步打开用户所说的话。企业家精神，一次漫长而孤独的旅行，是机械的核心：自从我离开终点线并开始生意以来，已经过去了六个多月。您认为工作与企业家精神之间的区别是什么？您最大的感觉是什么？ Zhu Zheqing：有很多差异。我在此期间进行了战斗，不是为了管理时间和疲劳，而是因为企业家精神本身是一条非常模糊的道路，或者根本没有道路。您想去的是它。作为公司的首席执行官，他似乎在说很多。您可以去任何地方，但实际上，您可以做出的决定是有限的，必须对公司和所有人负责。对于大公司而言，情况有所不同。您可以做出无数的决定或更改组。如果您无法继续此操作，则可以改变方向。机器的心脏：据了解，该团队是四个人的中心形成您今年四月和五月。现在有多少人？您是否考虑过扩展？ Zhu Zheqing：团队中目前有七个人。然后，将雇用两个或三个人，但是在收入规模扩大之前，设备可能未分配到10人以上。机器的心脏：您能说AI时代的企业家精神是“较轻的”吗？ Zhu Zheqing：是的，在AI时代，抛光模型和产品并未以多种方式使用。相反，当您做事时，您会保持警惕，因为还有更多的人。机器的心脏：您的办公室在哪里？您的日常工作状态是什么？ Zhu Zheqing：没有办公室。机器的心脏：那么通常什么时候在线会议？ Zhu Zheqing：所有在线，有些人在西雅图，有些人在湾区，有些人在新加坡。此外，我们都是终点线，我们被用于远程作业。即使我们没有办公室，我们也很高效，我们可以考虑生活。现在，我们每天举行在线会议，并讨论该怎么做。我会说。