👋 Welcome to my log!

Done! My 2020 WordPress log has been given a fresh start, thanks to AI.
💥 And a flood of new posts are coming right up! Haha.

AI Agent(从 Chatbot 到生产级 Agent)

AI Agent(从 Chatbot 到生产级 Agent) AI Agent是LLM应用的高级形态,能够自主规划、执行任务并与环境交互。 经典论文: Yao, S., et al. (2022). “ReAct: Synergizing Reasoning and Acting in Language Models.” ICLR. [论文链接] - ReAct框架,Agent核心范式 Wei, J., et al. (2022). “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models.” NeurIPS. [论文链接] Wang, G., et al. (2024). “A Survey on Large Language Model based Autonomous Agents.” arXiv. [论文链接] - Agent综述 一、整体演进路径 Chatbot → Tool Use → Agent → Production Agent(工业级) 演进说明: Chatbot: 仅能对话,无法执行外部操作 Tool Use: 能调用单一工具 Agent: 能自主规划并执行多步骤任务 Production Agent: 工业级,具备错误处理、权限控制、监控等能力 二、核心概念拆解 1️⃣ Chatbot LLM + Prompt ...

March 14, 2026 · Xiao Xiangtao

Prompt Engineering

Prompt Engineering https://www.coursera.org/learn/chatgpt-prompt-engineering-for-developers-project/home/welcome Prompt Engineering(提示工程)是设计和优化输入提示(prompts)以引导大语言模型生成期望输出的技术。这一领域随着GPT-3的发布而兴起,是连接用户意图与模型能力的关键桥梁。 经典论文: Brown, T. B., et al. (2020). “Language Models are Few-Shot Learners.” NeurIPS. [论文链接] - GPT-3论文,首次系统展示了prompt engineering的潜力 Wei, J., et al. (2022). “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models.” NeurIPS. [论文链接] 1. Prompting Principles(提示原则) Principle 1: Write clear and specific instructions(编写清晰具体的指令) 清晰性(Clarity)和具体性(Specificity)是prompt设计的核心原则。研究表明,模糊的指令会导致模型输出不确定性增加,而具体的指令能显著提升输出质量。 Tactic 1: Use delimiters to clearly indicate distinct parts of the input 分隔符(如 ```、"""、—、<>)能帮助模型识别输入的不同部分,避免混淆。这在处理包含多段文本或代码的任务时尤为重要。 Tactic 2: Ask for a structured output 要求结构化输出(如JSON、HTML、Markdown表格)便于后续程序处理,是构建AI应用的最佳实践。 ...

March 12, 2026 · Xiao Xiangtao

RAG (Retrieval-Augmented Generation)

RAG RAG (Retrieval-Augmented Generation) 是一种结合信息检索与文本生成的AI架构,通过检索外部知识库来增强LLM的回答能力。 经典论文: Lewis, P., et al. (2020). “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks.” NeurIPS. [论文链接] - RAG开山之作 Guu, K., et al. (2020). “REALM: Retrieval-Augmented Language Model Pre-Training.” ICML. [论文链接] Izacard, G., & Grave, É. (2021). “Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering.” EACL. [论文链接] - RAG的另一种实现 1. Context Window(上下文窗口) 概念 Context Window 指的是 大语言模型在一次推理时能够读取和理解的最大文本长度。 经典论文: Dai, Z., et al. (2019). “Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context.” ACL. [论文链接] - 突破固定上下文长度的开创性工作 通常包含: ...

March 8, 2026 · Xiao Xiangtao

Transformer概念与理解

Transformer:从入门到产品视角 📚 导论:为什么Transformer如此重要? Transformer模型是由Vaswani等人在2017年发表的论文《Attention Is All You Need》中提出的神经网络架构。它彻底改变了自然语言处理领域,成为现代大语言模型(如GPT、BERT、LLaMA等)的基石。 核心创新:完全抛弃传统的CNN/RNN架构,仅使用注意力机制来捕捉序列依赖关系,实现了两大突破: 并行计算:解决了RNN无法并行的问题,大幅提升训练速度 长程依赖:解决了RNN/LSTM在处理长序列时的梯度消失问题 🏗️ 一、Transformer整体架构 1.1 编码器-解码器结构 Transformer遵循Seq2Seq模型的编码器-解码器架构: 编码器(Encoder):将输入序列(如源语言句子)转换为连续表示 由N个相同的编码器层堆叠而成(原始论文中N=6) 每层包含:多头自注意力子层 + 前馈神经网络子层 解码器(Decoder):基于编码器输出生成目标序列(如目标语言句子) 同样由N个相同的解码器层堆叠而成 每层包含:掩码多头自注意力 + 编码器-解码器注意力 + 前馈神经网络 掩码机制:确保解码器在预测位置i时只能看到位置i之前的输出,防止信息泄露 1.2 核心组件概览 组件 功能 创新点 自注意力机制 捕捉序列内部任意两个位置的关系 全局建模、并行计算 多头注意力 从不同角度关注信息 并行子空间学习 位置编码 为模型提供序列位置信息 弥补注意力机制的位置盲点 前馈网络 对每个位置进行非线性变换 增强模型表达能力 残差连接 将输入直接连接到输出 缓解深层网络退化问题 层归一化 稳定每层的输出分布 加速收敛、提高稳定性 🔍 二、核心机制详解 2.1 自注意力机制(Self-Attention) 核心思想:让序列中的每个词都能直接关注到所有其他词,动态计算词与词之间的相关性。 实现步骤: 输入表示:每个输入词$x_i$被转换为嵌入向量 生成Q、K、V:通过三个可训练的权重矩阵$W_Q, W_K, W_V$将输入映射为查询(Query)、键(Key)、值(Value)向量 计算注意力分数:Query与所有Key的点积,表示当前位置对其他位置的关注程度 缩放与归一化:除以$\sqrt{d_k}$(防止点积过大导致梯度消失),经Softmax归一化为权重 加权聚合:用权重对Value进行加权求和,得到最终输出 数学公式: $$ \text{Attention}(Q,K,V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V $$ ...

February 20, 2026 · Xiao Xiangtao

国内电商平台支付方式对比

一、主流支付方式对比 1. 公对公现金支付 方式:柜台或网银主动转账、通过银行分账系统支付并获取回单 限额:可大额转账,5万以上走人行大额支付系统周末和假期不开可能受影响(工作日是前天晚上20:30一直跑到当天17:15) 到账时效:一般能及时到账 电商平台核验收款成功:财务手工核查银行账户、通过识别汇款备注里与订单关联的唯一代码自动核查、通过银行分账系统支付一般可实时确认 2. 网关支付 前往第三方支付公司或银行提供的统一收银台,跳转指定银行网银支付 限额:取决于支付卡类型及安全等级 支持银行:取决于统一收银台的服务提供方的合作银行数量 3. 聚合码/扫码支付 分主扫(客户手机APP唤起摄像头扫描商家二维码)和被扫(客户出示支付码给商家),电商网页用主扫的方案。 由聚合支付服务提供商提供的聚合码一般支持多个支付方式(比如微信、支付宝等),接入聚合码对商户更加方便。 由支付公司提供的单一渠道比如微信收款码、支付宝收款码只能支持指定APP扫码支付,好处是服务更稳定,体验更好。 4. 第三方APP支付 唤起第三方APP付款,国内头部的三家是微信、支付宝、云闪付,其中微信在线下场景覆盖广,支付宝依托淘宝生态、碰一碰支付创新持续和微信抢占市场,云闪付作为国家队,目前依托消费补贴、一站式银行卡管理功能也有一定流量且铺的比较广。其他的比如京东支付、连连支付等,体量和前三有一定差距,在特定场景有自身优势。 支持银行:基本齐全,且都支持余额、信用支付等方式。微信目前侧重个人支付,不支持绑定公账,支付宝可以创建企业账户绑定公账支付。 5. 移动快捷支付 打开支付渠道H5页面绑定银行卡付款,目前用的较少,主流支付公司都有该形式,但H5页面安全风险相较APP支付更高,且用户体验较差(需重复登录)。 6. 银行卡快捷支付 通过和支付公司合作,平台对接支付公司,用户在平台绑卡后选卡支付。 部分渠道可以免密支付,平台需承担部分风控责任,但用户体验好,支付速度快。 支持银行:取决于服务提供方的合作银行数量。 7. 账户余额支付 购买支付牌照或通过和第三方支付公司合作提供钱包功能,支持用户充值余额支付。 平台需要针对充值、支付、提现做一定风控措施。该方式对用户体验好,且有助于提高用户粘性。 8. 金融白条支付 比较知名的有花呗、京东白条、美团月付等,通过金融机构授信一定额度给用户支付,C端大部分有一个月的平台贴息。该方式可以大幅提升用户粘性,特别是一些B端客户对现金流比较重视,提供账期可以建立紧密合作关系,但这对信用评估和风控有较高要求。 9. 月结 由商家针对指定客户允许其赊账或签订月结的协议,商家自行记账并要求客户定期还款,平台如果有自营业务,也会考虑设计相关功能。该方式交易不受第三方担保,可以不经过电商平台,通常是商家与合作紧密熟悉的客户采用该方式。 10. 数字人民币 等同于现金支付,目前支付APP和扫码支付,使用量较低。 11. 代付 生成订单并将代付收银台分享给其他用户进行支付。代付收银台页面提供的支付方式需要考虑代付用户的身份,设备环境等因素。 12. 先用后付 授信门槛低,通常额度小,不计入央行征信,由平台担保并向商家收取交易服务费,C端通常用户要开通了绑定银行卡代扣支付方式,个人认为该方式可以降低用户的下单决策成本,同时不像花呗等信用支付方式那么重。

January 29, 2026 · Xiangtao XIAO

初步体验:用扣子生成一个雅思口语练习网页

3.15更新: //3pvtkwzwrm.coze.site coze生产环境的参数是部署时系统自动赋值的,不需要自己填API key之类的参数。重新做了一个在生产环境就跑通了,具体方法是让AI基于前一个应用生成一个详细的提示词包含功能点、技术架构等内容,感觉提示词专业的话对于编码还是有帮助的,但是依然会出现细节上的bug,需要进行两三次修复。功能出了问题好排查,配置或者网络等细节出了问题不是程序员的话真的不太好排查,也许是我对一些技术细节还不够了解。 最近正好考虑雅思,新东方的雅思小程序推出了一个AI练真题的功能,参考这个试了下能否用扣子直接生成一个类似的功能。 功能介绍: 根据选择的题型随机生成题目,点击开始录音可以根据题型限制录音时长。录音结束后进行语音识别,并通过AI对识别结果进行分析,给出评分、改进建议和AI扩写的答案。 首页: 这里题目下方的灰色提示是AI自动补全的功能,prompt并未做要求,同时录音时间的文字提示也是AI补全的,页面也是响应式,交互总体比较友好。我也没有对UI风格做要求,感觉AI味比较浓(非贬义),第一遍生成的字体较小做了一次调整。 评分页: 在扣子上直接部署后可能是api的原因,生成环境语音识别功能没有跑通,但是在测试环境实现了完整的功能。 整个过程大概用了两个小时,修复bug的过程比较顺畅,会进行自测基本功能问题提了都可以修复。但是涉及到接口调用,环境部署等导致的问题时,修复bug的技术要求就直线上升了,需要你能够发现比较具体的问题并准确描述,否则的话只是基于前端的报错,AI可能无法定位到准确问题,对无开发背景的人来说还是有难度。

January 28, 2026 · Xiangtao XIAO

股市心得

短期的涨跌难以预测,有太多的干扰因素和难以预料的事情,网络上的技术分析基本没有参考的必要性。只聊经济不聊政治军事,不聊行业发展的也基本可以不看。 长期趋势的判断更加重要,不要被短期的盈亏影响心智,忘记了对于长期趋势的判断,操作应该是基于自己对于长期趋势的判断,这样才能有信心有定力。 抖音、微博等推荐功能在做”恶“,信息流的推荐不仅会放大人性的恶,吸引人不断沉沦,如今看来还有很多故意带节奏影响心智的信息,这些信息煽动性大反而容易获得巨大的流量,这些平台在其中扮演的角色光彩吗? 战略定力很重要,调整心态,逆人性操作。这也是为什么一般说炒股要用闲钱,要当作这笔钱不存在了,这样才不影响心态。 炒股本质就是交易,会做生意炒股也能赚点钱。假如中国未来真的进入了长期牛市,也许学会投资是一个难得的翻身的机会?

October 20, 2024 · Xiangtao XIAO

反电信诈骗洗钱与风控

最近接触到了一些关于反诈骗洗钱的工作,对电信诈骗洗钱等有了比较直观的认知。电商平台很容易被犯罪份子利用,作为产品经理,设计产品时一定要有风险意识,否则产品上出现犯罪情况,轻则有自责感、负罪感,重则接受行政处罚,双罚制实施后上至平台下至负责人均会受罚,打击犯罪,人人有责。 相关资料 充值提现平台,缘何沦为诈骗犯“洗钱工具”? //zhuanlan.zhihu.com/p/151289531 中华人民共和国反电信网络诈骗法(全文) //zhuanlan.zhihu.com/p/560714960 风控系统设计 对于电商平台的账户系统,一般会有开户、储值、交易、提现几个主要功能。在设计之初,每个功能都需要针对业务场景做限制,功能上线后,需要考虑可能被利用或存在风险的场景,对用户数据做监控,及时识别异常用户行为,做对应的限制、告警、以及拦截。 开户环节,要充分落实KYC,非目标用户无需开放开户入口,如果账户权限有多种类别,则对用户也要严格分类对应,满足指定条件用户可开对应账户。不要为了后期功能改造的灵活性,或者为了业务的快速扩张,而放松限制,设计时务必要在业务和安全方面做好衡量,追求业务指标而忽视安全可能导致严重后果。 储值环节,要考虑支持哪些支付渠道储值,一般来说信用卡支付要禁止,公私账支付也要根据平台虚拟账户性质做对应处理。另外,用户是否有储值的需要?一般需要储值多少额度?用户一般在什么时间操作储值?这些特征都需要研究并做对应风控,比如限制储值额度,禁止部分用户储值,禁止部分业务使用余额支付,异常时间储值告警等。 交易的监控是电商平台的核心工作之一,一般来说平台对用户和商家入驻已经做了限制和审核,平台仅需要核对买卖双方的交易真实性即可。从分账系统的角度看,交易的概念更为广泛,从A账户到B账户的转账,即是一笔交易,在用户购买商品行为之外,其他业务场景也可能出现交易。这里我们需要检查交易的合理性,不仅针对正常的用户购买行为,还需检查用户账户之间和商家账户之间可能的转账行为。对于特殊业务场景导致的和购买行为不对应的交易,应该做严格限制,最低程度的满足业务场景需求即可,超出此场景的交易一律禁止。对于用户购买产生的交易,则要检查其购买频次、金额,以避免用户和商家串通,伪造交易利用平台洗钱,必要时需要校验付款用户身份以防范盗号、卖号等情况。 原路退款一般没有风险,提现是用户账户出金的唯二路径(不含平台转账扣费等),不管前面出现了哪些问题,最后一道防火墙如果拦住了,就可以避免资金损失。提现本身需要做安全校验,另外提现还需要严格限制资金去向。对于提现金额、笔数、到账时效都需要做风控,如果是提现次数不多的B端平台,交给人工审核也是个好主意。 总的来说,风控既要防竞对,又要防内鬼,还要防未知的犯罪份子,设计产品时不能只想到一方,不同坏人做坏事,手段会有所区别,做产品的,对于本身存在较大风险的业务,能不做尽量别做,一定要做的话,还是想想清楚什么方案风险最小。

October 22, 2023 · Xiangtao XIAO

和美术馆(HEM)

和美术馆由普利兹克获奖建筑师安藤忠雄担任建筑设计。建筑理念融入“天圆地方”的中原正朔文化元素,主体由圆弧形与方形的几何结构组成。正中心的圆形逐渐变换重心、比例、高度,交错重叠,从内到外、从建筑到城市,慢慢扩展延伸。和美术馆的“和”既是“协和”,也是“混和”,象征空间融合境界的理念。 馆藏有部分国画精品,包括张大千、吴冠中、黄宾虹等画家作品。 此外不定期有国内外艺术家作品展。这次去的时候有极简艺术家夏纳•霍维兹作品展:交织的韵律。作品特点大致是在方格纸上按数学规律重复基础图案、线条、色彩,形成有韵律感的画作。没有看到大型作品,有启发但不是很感兴趣。 在4楼可以参观艺术品修复工作,有点像三星堆博物馆的参观形式。但是隔着透明玻璃一直看着里边工作人员其实感觉有些尴尬。

June 4, 2023 · Xiangtao XIAO

初识跨境支付

从《跨境电子商务支付与结算》一书出发,了解跨境支付领域。 跨境支付的几个基本概念 汇(外汇) 外汇,英文名是Foreign currency,是货币行政当局( 中央银行、货币管理机构、 外汇平准基金 及财政部)以 银行存款、财政部库券、长短期政府证券等形式保有的在 国际收支逆差 时可以使用的债权。包括外国货币、外币存款、外币有价证券(政府公债、国库券、公司债券、股票等)、 外币支付凭证(票据、银行存款凭证、邮政储蓄凭证等)。 广义 一国拥有的一切以外币表示的资产。是指货币在各国间的流动以及把一个国家的 货币兑换 成另一个国家的货币,借以清偿国际间债权、债务关系的一种专门性的经营活动。实际上就是货币行政当局( 中央银行、货币管理机构、外汇平准基金及财政部)以银行存款、 财政部 库券、长短期政府债券等形式所保有的在 国际收支逆差 时可以使用的债权。 狭义 以外国货币表示的,为各国普遍接受的,可用于国际间债权债务结算的各种支付手段。必须具备三个特点:可支付性(必须以外国货币表示的资产)、可获得性(必须是在国外能够得到补偿的债权)和可换性(必须是可以自由兑换为其他支付手段的外币资产)。 浮动汇率制度 法郎的汇率水平,并非由投机者或贸易平衡,甚至不是 鲁尔区 的冒险行为所决定的,而是法国的纳税人愿意拿出多少自己的收入,去支付给法国的食利者们。——凯恩斯 汇率的一个基本来源是维持购买力平价,比如在我国买一个鸡蛋1元,在美国买一个鸡蛋0.2美元,则1rmb就应该对0.2usd。如果没有汇率而是1:1兑换,那么1元人民在国内可以买一个蛋,换成美元在美国可以买几个蛋,国内的人就会把人民币换成美元买美国的蛋,导致人民币流向美国,美国的蛋流向中国。这样一来市场就对国内的蛋商失去信心,国内商品价格没有竞争力,资金都往国外跑,而美国的蛋则变得供小于求,物价飞升,美国百姓买不起蛋,中国用钞票轻松换走了美国的蛋,这么一看中美都不乐意了,为了维持国内市场的稳定和国际贸易的公平,需要有汇率来换算双方货币。 当然现实是反过来的,过去我们可以用黄金来作为衡量的基准,后来美国称霸世界美元取代了黄金,国际结算都用美元,美国可以印钞票从全世界买蛋。1973年,以美元为中心的固定汇率制完全解体,各国(或地区)纷纷实行浮动汇率制。实际情况下汇率还会受到贸易保护、金融市场、政治等因素的影响,为了摆脱美元霸权,我们开始推行人民币结算,另外我们也制定了更为稳定可靠的汇率制度。 我国实施以市场供求为基础、 参考一篮子货币, 有管理的浮动汇率制度。中国人民银行根据前一日 银行间外汇市场 形成的价格,公布人民币对美元等主要货币的汇率,各银行以此为依据,在中国人民银行规定的浮动幅度内自行挂牌。人行本身是银行间外汇市场的重要参与者,可以根据货币政策买卖外汇,调整汇率。 传统跨境支付方式 汇付(Remittance,即汇款) 汇付属于商业信用,银行只是接受委托提供服务,是否支付取决于买方遵守合同约定。 信汇:汇出行寄信汇委托书给汇入行,解付金额给收款方 电汇:汇出行拍发加压电报、电传给汇入行,解付金额 票汇:付款方使用汇票、本票、支票等工具主动支付给收款方 托收 托收属于逆汇,即单据流向与资金流相反,卖房(出口方)开具以进口方为汇款人的汇票,委托出口方银行通过其在进口方的分行或代理行向进口方收款的一种结算方式。 托收同样属于商业信用,银行完全根据卖房指示收款,是否付款取决于买房的信用。 光票托收:一般是小额、预付款、分期或者收取贸易从属费用等,金融单据不跟随商业票据 跟单托收:金融票据跟随商业票据 信用证(Letter of Credit,L/C) 信用证属于银行信用。信用证不依赖于买卖商业合同(自足文件,self-sufficient instrument),不和货物关联(纯单据业务),开证银行有首要付款责任。 新型跨境支付方式 传统的跨境支付贸易主要为B2B大额贸易,支付手段多依靠银行完成。伴随着互联网的发展与普及,B2B、C2C跨境电子商务以及小额B2B贸易市场不断发展,涌现了许多新型跨境支付方式,就国内来说,这些支付方式多为持有支付业务许可证(央行颁发)和外汇管理局准许开展跨境电子商务外汇支付业务试点的批复文件的第三方支付机构所开发。 以下列举了主流的新型跨境支付方式: 国内:支付宝、微信支付、连连支付、pingPong 国外:Paypal、Western Union、WebMoney(在俄语系国家、日本、欧美使用较多) 以上支付机构的主要收入来源为支付手续费和支付解决方案。另外还有汇率差等非常规性收入。 相较传统的跨境支付方式,新型跨境支付具有:手续费低、付款简单、到账时间快、能应对平台高并发交易场景等优势。 第三方机构的支付实现 跨境电子商务平台一般会接入多个支付通道并进行路由,和境内支付类似。 税务 金融及风险应对 有关技术

May 5, 2023 · Xiangtao XIAO