AI Agent(从 Chatbot 到生产级 Agent)

AI Agent(从 Chatbot 到生产级 Agent) AI Agent是LLM应用的高级形态,能够自主规划、执行任务并与环境交互。 经典论文: Yao, S., et al. (2022). “ReAct: Synergizing Reasoning and Acting in Language Models.” ICLR. [论文链接] - ReAct框架,Agent核心范式 Wei, J., et al. (2022). “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models.” NeurIPS. [论文链接] Wang, G., et al. (2024). “A Survey on Large Language Model based Autonomous Agents.” arXiv. [论文链接] - Agent综述 一、整体演进路径 Chatbot → Tool Use → Agent → Production Agent(工业级) 演进说明: Chatbot: 仅能对话,无法执行外部操作 Tool Use: 能调用单一工具 Agent: 能自主规划并执行多步骤任务 Production Agent: 工业级,具备错误处理、权限控制、监控等能力 二、核心概念拆解 1️⃣ Chatbot LLM + Prompt ...

March 14, 2026 · Xiao Xiangtao

Prompt Engineering

Prompt Engineering https://www.coursera.org/learn/chatgpt-prompt-engineering-for-developers-project/home/welcome Prompt Engineering(提示工程)是设计和优化输入提示(prompts)以引导大语言模型生成期望输出的技术。这一领域随着GPT-3的发布而兴起,是连接用户意图与模型能力的关键桥梁。 经典论文: Brown, T. B., et al. (2020). “Language Models are Few-Shot Learners.” NeurIPS. [论文链接] - GPT-3论文,首次系统展示了prompt engineering的潜力 Wei, J., et al. (2022). “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models.” NeurIPS. [论文链接] 1. Prompting Principles(提示原则) Principle 1: Write clear and specific instructions(编写清晰具体的指令) 清晰性(Clarity)和具体性(Specificity)是prompt设计的核心原则。研究表明,模糊的指令会导致模型输出不确定性增加,而具体的指令能显著提升输出质量。 Tactic 1: Use delimiters to clearly indicate distinct parts of the input 分隔符(如 ```、"""、—、<>)能帮助模型识别输入的不同部分,避免混淆。这在处理包含多段文本或代码的任务时尤为重要。 Tactic 2: Ask for a structured output 要求结构化输出(如JSON、HTML、Markdown表格)便于后续程序处理,是构建AI应用的最佳实践。 ...

March 12, 2026 · Xiao Xiangtao

RAG (Retrieval-Augmented Generation)

RAG RAG (Retrieval-Augmented Generation) 是一种结合信息检索与文本生成的AI架构,通过检索外部知识库来增强LLM的回答能力。 经典论文: Lewis, P., et al. (2020). “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks.” NeurIPS. [论文链接] - RAG开山之作 Guu, K., et al. (2020). “REALM: Retrieval-Augmented Language Model Pre-Training.” ICML. [论文链接] Izacard, G., & Grave, É. (2021). “Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering.” EACL. [论文链接] - RAG的另一种实现 1. Context Window(上下文窗口) 概念 Context Window 指的是 大语言模型在一次推理时能够读取和理解的最大文本长度。 经典论文: Dai, Z., et al. (2019). “Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context.” ACL. [论文链接] - 突破固定上下文长度的开创性工作 通常包含: ...

March 8, 2026 · Xiao Xiangtao

Transformer概念与理解

Transformer:从入门到产品视角 📚 导论:为什么Transformer如此重要? Transformer模型是由Vaswani等人在2017年发表的论文《Attention Is All You Need》中提出的神经网络架构。它彻底改变了自然语言处理领域,成为现代大语言模型(如GPT、BERT、LLaMA等)的基石。 核心创新:完全抛弃传统的CNN/RNN架构,仅使用注意力机制来捕捉序列依赖关系,实现了两大突破: 并行计算:解决了RNN无法并行的问题,大幅提升训练速度 长程依赖:解决了RNN/LSTM在处理长序列时的梯度消失问题 ...

February 20, 2026 · Xiao Xiangtao

国内电商平台支付方式对比

一、主流支付方式对比 1. 公对公现金支付 方式:柜台或网银主动转账、通过银行分账系统支付并获取回单 限额:可大额转账,5万以上走人行大额支付系统周末和假期不开可能受影响(工作日是前天晚上20:30一直跑到当天17:15) 到账时效:一般能及时到账 电商平台核验收款成功:财务手工核查银行账户、通过识别汇款备注里与订单关联的唯一代码自动核查、通过银行分账系统支付一般可实时确认 2. 网关支付 前往第三方支付公司或银行提供的统一收银台,跳转指定银行网银支付 限额:取决于支付卡类型及安全等级 支持银行:取决于统一收银台的服务提供方的合作银行数量 3. 聚合码/扫码支付 分主扫(客户手机APP唤起摄像头扫描商家二维码)和被扫(客户出示支付码给商家),电商网页用主扫的方案。 由聚合支付服务提供商提供的聚合码一般支持多个支付方式(比如微信、支付宝等),接入聚合码对商户更加方便。 由支付公司提供的单一渠道比如微信收款码、支付宝收款码只能支持指定APP扫码支付,好处是服务更稳定,体验更好。 4. 第三方APP支付 唤起第三方APP付款,国内头部的三家是微信、支付宝、云闪付,其中微信在线下场景覆盖广,支付宝依托淘宝生态、碰一碰支付创新持续和微信抢占市场,云闪付作为国家队,目前依托消费补贴、一站式银行卡管理功能也有一定流量且铺的比较广。其他的比如京东支付、连连支付等,体量和前三有一定差距,在特定场景有自身优势。 支持银行:基本齐全,且都支持余额、信用支付等方式。微信目前侧重个人支付,不支持绑定公账,支付宝可以创建企业账户绑定公账支付。 5. 移动快捷支付 打开支付渠道H5页面绑定银行卡付款,目前用的较少,主流支付公司都有该形式,但H5页面安全风险相较APP支付更高,且用户体验较差(需重复登录)。 6. 银行卡快捷支付 通过和支付公司合作,平台对接支付公司,用户在平台绑卡后选卡支付。 部分渠道可以免密支付,平台需承担部分风控责任,但用户体验好,支付速度快。 支持银行:取决于服务提供方的合作银行数量。 7. 账户余额支付 购买支付牌照或通过和第三方支付公司合作提供钱包功能,支持用户充值余额支付。 平台需要针对充值、支付、提现做一定风控措施。该方式对用户体验好,且有助于提高用户粘性。 8. 金融白条支付 比较知名的有花呗、京东白条、美团月付等,通过金融机构授信一定额度给用户支付,C端大部分有一个月的平台贴息。该方式可以大幅提升用户粘性,特别是一些B端客户对现金流比较重视,提供账期可以建立紧密合作关系,但这对信用评估和风控有较高要求。 9. 月结 由商家针对指定客户允许其赊账或签订月结的协议,商家自行记账并要求客户定期还款,平台如果有自营业务,也会考虑设计相关功能。该方式交易不受第三方担保,可以不经过电商平台,通常是商家与合作紧密熟悉的客户采用该方式。 10. 数字人民币 等同于现金支付,目前支付APP和扫码支付,使用量较低。 11. 代付 生成订单并将代付收银台分享给其他用户进行支付。代付收银台页面提供的支付方式需要考虑代付用户的身份,设备环境等因素。 12. 先用后付 授信门槛低,通常额度小,不计入央行征信,由平台担保并向商家收取交易服务费,C端通常用户要开通了绑定银行卡代扣支付方式,个人认为该方式可以降低用户的下单决策成本,同时不像花呗等信用支付方式那么重。

January 29, 2026 · Xiangtao XIAO

初步体验:用扣子生成一个雅思口语练习网页

3.15更新: //3pvtkwzwrm.coze.site coze生产环境的参数是部署时系统自动赋值的,不需要自己填API key之类的参数。重新做了一个在生产环境就跑通了,具体方法是让AI基于前一个应用生成一个详细的提示词包含功能点、技术架构等内容,感觉提示词专业的话对于编码还是有帮助的,但是依然会出现细节上的bug,需要进行两三次修复。功能出了问题好排查,配置或者网络等细节出了问题不是程序员的话真的不太好排查,也许是我对一些技术细节还不够了解。 最近正好考虑雅思,新东方的雅思小程序推出了一个AI练真题的功能,参考这个试了下能否用扣子直接生成一个类似的功能。 功能介绍: 根据选择的题型随机生成题目,点击开始录音可以根据题型限制录音时长。录音结束后进行语音识别,并通过AI对识别结果进行分析,给出评分、改进建议和AI扩写的答案。 首页: 这里题目下方的灰色提示是AI自动补全的功能,prompt并未做要求,同时录音时间的文字提示也是AI补全的,页面也是响应式,交互总体比较友好。我也没有对UI风格做要求,感觉AI味比较浓(非贬义),第一遍生成的字体较小做了一次调整。 评分页: 在扣子上直接部署后可能是api的原因,生成环境语音识别功能没有跑通,但是在测试环境实现了完整的功能。 整个过程大概用了两个小时,修复bug的过程比较顺畅,会进行自测基本功能问题提了都可以修复。但是涉及到接口调用,环境部署等导致的问题时,修复bug的技术要求就直线上升了,需要你能够发现比较具体的问题并准确描述,否则的话只是基于前端的报错,AI可能无法定位到准确问题,对无开发背景的人来说还是有难度。

January 28, 2026 · Xiangtao XIAO

初识跨境支付

从《跨境电子商务支付与结算》一书出发,了解跨境支付领域。 跨境支付的几个基本概念 汇(外汇) 外汇,英文名是Foreign currency,是货币行政当局( 中央银行、货币管理机构、 外汇平准基金 及财政部)以 银行存款、财政部库券、长短期政府证券等形式保有的在 国际收支逆差 时可以使用的债权。包括外国货币、外币存款、外币有价证券(政府公债、国库券、公司债券、股票等)、 外币支付凭证(票据、银行存款凭证、邮政储蓄凭证等)。 广义 一国拥有的一切以外币表示的资产。是指货币在各国间的流动以及把一个国家的 货币兑换 成另一个国家的货币,借以清偿国际间债权、债务关系的一种专门性的经营活动。实际上就是货币行政当局( 中央银行、货币管理机构、外汇平准基金及财政部)以银行存款、 财政部 库券、长短期政府债券等形式所保有的在 国际收支逆差 时可以使用的债权。 狭义 以外国货币表示的,为各国普遍接受的,可用于国际间债权债务结算的各种支付手段。必须具备三个特点:可支付性(必须以外国货币表示的资产)、可获得性(必须是在国外能够得到补偿的债权)和可换性(必须是可以自由兑换为其他支付手段的外币资产)。 浮动汇率制度 法郎的汇率水平,并非由投机者或贸易平衡,甚至不是 鲁尔区 的冒险行为所决定的,而是法国的纳税人愿意拿出多少自己的收入,去支付给法国的食利者们。——凯恩斯 汇率的一个基本来源是维持购买力平价,比如在我国买一个鸡蛋1元,在美国买一个鸡蛋0.2美元,则1rmb就应该对0.2usd。如果没有汇率而是1:1兑换,那么1元人民在国内可以买一个蛋,换成美元在美国可以买几个蛋,国内的人就会把人民币换成美元买美国的蛋,导致人民币流向美国,美国的蛋流向中国。这样一来市场就对国内的蛋商失去信心,国内商品价格没有竞争力,资金都往国外跑,而美国的蛋则变得供小于求,物价飞升,美国百姓买不起蛋,中国用钞票轻松换走了美国的蛋,这么一看中美都不乐意了,为了维持国内市场的稳定和国际贸易的公平,需要有汇率来换算双方货币。 当然现实是反过来的,过去我们可以用黄金来作为衡量的基准,后来美国称霸世界美元取代了黄金,国际结算都用美元,美国可以印钞票从全世界买蛋。1973年,以美元为中心的固定汇率制完全解体,各国(或地区)纷纷实行浮动汇率制。实际情况下汇率还会受到贸易保护、金融市场、政治等因素的影响,为了摆脱美元霸权,我们开始推行人民币结算,另外我们也制定了更为稳定可靠的汇率制度。 我国实施以市场供求为基础、 参考一篮子货币, 有管理的浮动汇率制度。中国人民银行根据前一日 银行间外汇市场 形成的价格,公布人民币对美元等主要货币的汇率,各银行以此为依据,在中国人民银行规定的浮动幅度内自行挂牌。人行本身是银行间外汇市场的重要参与者,可以根据货币政策买卖外汇,调整汇率。 传统跨境支付方式 汇付(Remittance,即汇款) 汇付属于商业信用,银行只是接受委托提供服务,是否支付取决于买方遵守合同约定。 信汇:汇出行寄信汇委托书给汇入行,解付金额给收款方 电汇:汇出行拍发加压电报、电传给汇入行,解付金额 票汇:付款方使用汇票、本票、支票等工具主动支付给收款方 托收 托收属于逆汇,即单据流向与资金流相反,卖房(出口方)开具以进口方为汇款人的汇票,委托出口方银行通过其在进口方的分行或代理行向进口方收款的一种结算方式。 托收同样属于商业信用,银行完全根据卖房指示收款,是否付款取决于买房的信用。 光票托收:一般是小额、预付款、分期或者收取贸易从属费用等,金融单据不跟随商业票据 跟单托收:金融票据跟随商业票据 信用证(Letter of Credit,L/C) 信用证属于银行信用。信用证不依赖于买卖商业合同(自足文件,self-sufficient instrument),不和货物关联(纯单据业务),开证银行有首要付款责任。 新型跨境支付方式 传统的跨境支付贸易主要为B2B大额贸易,支付手段多依靠银行完成。伴随着互联网的发展与普及,B2B、C2C跨境电子商务以及小额B2B贸易市场不断发展,涌现了许多新型跨境支付方式,就国内来说,这些支付方式多为持有支付业务许可证(央行颁发)和外汇管理局准许开展跨境电子商务外汇支付业务试点的批复文件的第三方支付机构所开发。 以下列举了主流的新型跨境支付方式: 国内:支付宝、微信支付、连连支付、pingPong 国外:Paypal、Western Union、WebMoney(在俄语系国家、日本、欧美使用较多) 以上支付机构的主要收入来源为支付手续费和支付解决方案。另外还有汇率差等非常规性收入。 相较传统的跨境支付方式,新型跨境支付具有:手续费低、付款简单、到账时间快、能应对平台高并发交易场景等优势。 第三方机构的支付实现 跨境电子商务平台一般会接入多个支付通道并进行路由,和境内支付类似。 税务 金融及风险应对 有关技术

May 5, 2023 · Xiangtao XIAO

关于提现功能的一点思考

众所周知,微信零钱的提现会收取千分之一的手续费,有人在使用中专门注意过这个手续费是怎么收的吗?说来惭愧,作为产品经理的我并没有好好研究过这个功能,直到这次碰到要做平台用户账户的提现功能,研究后才发现习以为常的微信零钱提现,也是有些小设计在的。 Q:假设你要提现1万元,现在钱包里有两万,微信会怎么扣款呢? A:你的银行卡会到账1万元,但是钱包会有两条流水:1万元提现,以及10元的服务费,钱包里还剩下9990元。 Q:假设你还是要提现1万元,现在钱包里正好有1万元,微信又是怎么处理的呢? A:此时自不能再扣除10010元了,钱包里只有1万,那从1万里扣10元手续费,银行卡到账9990元不就好了,真是如此吗?实际上,此时微信计算的手续费为9.99元,银行卡到账9990.01元。 为什么是9.99?因为你会发现,第一种情况手续费比例可以算作 10/(10000+10),在第二种情况下,手续费比例则算做了 10/10000,当用户想把钱包里的钱全部提走,手续费变相的变高了,这是不合理的,遇到深究的用户,可能有法律风险。可是要避开第二种手续费情况,如何处理比较合适呢?此时用户输入的提现金额就是钱包余额,要扣除手续费,到账金额已经不可能与用户输入的提现金额相等了。 微信的方案是计算出了一个区分情况1和情况2的提现金额,即 情况1下 到账金额加上手续费正好等于钱包余额对应的提现金额。输入的提现金额再大,就会变成情况2,这时系统自动把提现金额改为临界值,不管输入多大的提现金额,实际提现始终是 到账 + 手续费 = 全部余额 的情况。比如上述例子里,9990.01就是这个分界线,9990.01~10000元输入此间任意提现金额,到账金额都是9990.01,手续费都是9.99元。

December 28, 2021 · Xiangtao XIAO

新人产品经理入职总结

总结一下新入职要做哪些准备,踩过的坑加深印象。 1.软件安装 了解公司常用的软件,如果有现成安装好的更好,把必备软件安装好并准备好账号。如果是陌生的软件,有空的话最好学一下使用方式,找同事问。 2.工作模式了解 了解公司的组织架构,一般的工作流程,产品开发是使用内部系统,还是使用文档,或者使用第三方软件等,公司部门如何协作。 对公司技术部门的情况有一个大概的了解,条件允许的话了解下大概技术水平,主要技术路线等。 3.认识同事 同事不用急于熟络,也不可能一下子记住所有人,这个环节更重要的是让对方认识你。但是要记住接下来和你合作会比较密切的同事,留下好印象。 感受一下部门氛围与工作节奏,了解自己上级的工作风格。 有机会请同事或上级吃个饭,进一步请教了解公司的情况以及对自己的要求。 4.熟悉业务* 几个需要背下来的:公司的基本业务板块、公司价值观、公司内部常用术语、公司主要业绩指标数值、公司主要竞争对手、市场行情与政府政策。一般公司会有一份介绍文档或PPT,一些额外信息需要向相关同事请教。 需要熟悉的产品:对于自己所在部门的产品,主要流程都走一遍,用一用,最好能用思维导图做个归纳思路会清晰很多。主要竞品也要用一用,了解异同。 对于自己负责接手的产品,要整个用一便,每个功能,每个状态都要试用,并画出对应的流程图,对于不清晰的地方找对接同事确认清楚。对于自己感到疑惑或者功能比较复杂的,如果公司需求文档有保留,看一下以前的需求文档,顺便了解一下公司对需求文档的要求,以及写作规范。 对于自己负责产品涉及到的业务,最好能够亲自体验,至少基本了解业务的情况:现有缺陷,发展目标,核心竞争力/价值,商业模式等。 要具备对数据的敏感性,拿到相关埋点数据与统计数据做分析,做到心中有数。 5.需求文档撰写基本要求 工作很忙,不要重复造轮子,如果已有成熟的相关产品,或者网络上有相关介绍文档,务必了解,也能应对其他人后续对产品的挑战。 写清楚需求的背景——开发更容易理解,也证明自己不是乱提需求。 写清楚功能的入口——开发可能也是新接手,未必了解清楚。 写清楚不同状态、交互的流转——技术在实现时可能不会注意到这些,即便是显而易见的逻辑,也要写清楚。 涉及到数字或选项等,写清楚:极值、默认值、格式要求、格式要求的实现形式——基本要求。 写清楚异常情况处理——对于能够预见的异常情况,写清楚如何避免或处理。每一步都必须要考虑可能存在的异常情况。 很重要的——一定要给图。 6.行事准则 低调谦虚,对同事和开发有礼貌。对于日常遇到的问题,要换位思考,请对方办事注意措辞和时间,大家工作都很忙。 需求要一定要和开发和测试同事确认清楚,确保开发和测试知情。不能写完就完事。 开发完成后,一定要亲自测试,上线后要亲自确认效果无误。

July 30, 2021 · Xiangtao XIAO