Uncategorized

ROS2学习笔记:C++最小支持Parameters的节点

通过如下命令新建一个package框架: ros2 pkg create –build-type ament_cmake –license Apache-2.0 cpp_parameters –dependencies rclcpp 支持Parameters的最小节点源代码: #include <chrono> #include <functional> #include <string> #include <rclcpp/rclcpp.hpp> using namespace std::chrono_literals; class MinimalParam : public rclcpp::Node { public: MinimalParam() : Node(“minimal_param_node”) { auto param_desc = rcl_interfaces::msg::ParameterDescriptor{}; param_desc.description = “This parameter is mine!”; this->declare_parameter(“my_parameter”, “world”, param_desc); timer_ = this->create_wall_timer( 1000ms, std::bind(&MinimalParam::timer_callback, this)); } void […]

ROS2学习笔记:C++最小支持Parameters的节点 Read More »

Copilot初始化技巧

最近的一个学习项目使用VS Code和Copilot为主要开发环境,Vibe Coding真是大大提高生产力,这个项目几乎99%的代码都是AI写的,整体来说是一个结伴编程的模式,我充当整体架构把控,AI帮我每个模块每个模块来实现。这个项目很复杂,持续了几个月,而VS Code的Copilot上下文很可怜,所以我充分使用了大量markdown文档记录进度记录plan,也用到了copilot-instructions.md 来让Copilot每次对话开始时主动读取一些规范性背景性得文档。可是实际用下来到你觉到大模型仅止步于此,并没有主动执行读各个模块的plan/progress的步骤。所以每次重启IDE后,模型感觉都很弱智,说了解背景也了解一点,但是不多。 解决首次开IDE后AI大模型对于记忆丢失的问题,一个解决方法是将项目重要背景以及当前进展写入copilot-instructions.md,但是这会使这个文件超级臃肿,另外一方面是我现在用到了,创建一个prompt脚本,每次新打开IDE手动运行一下,一方面让Copilot真正读一下其他的几个plan/progress文档,另一方面给我们一个当前状态的总结。 /session-start 使用这套模式主要是由于Copilot对于历史记忆做的不好,另外这套模式能够生效的一个前提是plan/progress文档能够及时且准备更新,我是通过一个skills完成的,当和大模型说特定命令,大模型就会逐个将模块中各自的以及项目整体的plan/progress根据当前的修改完成更新: 这是我使用VS Code Copilot的一些心得,如果对你有用,帮忙点个赞吧。      

Copilot初始化技巧 Read More »

大模型学习笔记:Agent智能体

概念: 智能体(Agent)是一种能够自主规划、决策、执行任务的组件,核心是让大预言模型(LLM)根据任务需求,选择并调用工具,完成单靠模型自身无法解决的复杂问题。 没有Agent时,LLM只能基于自身训练数据回答问题,遇到需要实时数据、复杂计算、外部工具调用的场景就会卡壳。 有了Agent后,LLM就像一个“指挥官”,能思考任务步骤–>选择合适工具–>执行工具调用–>根据结果调整策略,直到完成任务。 核心特点: 目标驱动:围绕用户的具体任务目标展开工作 工具调用能力:能连接外部工具,弥补LLM的局限性 自主决策与迭代:不需要人工干预,能根据工具返回的结果,判断是否需要继续调用工具,或直接生成最终答案 核心区别: 普通Chain: 执行流程固定,按预设步骤运行 工具调用路径写死在代码里 适合简单,标准化任务 Agent: 执行流程动态,根据任务和结果自主调整 工具选择由LLM思考决定 适合复杂、多步骤、需要决策的步骤 Agent智能体 = 大语言模型(大脑)+ 工具箱(手脚)+ 决策逻辑(思维),让大模型拥有了感知外部并影响现实的能力 Agent初体验   from langchain.agents import create_agent from langchain_community.chat_models.tongyi import ChatTongyi from langchain_core.tools import tool @tool(description=”获取天气信息的工具”) def get_weather(location):     # 这里可以调用天气API获取天气信息,暂时返回一个模拟的结果     return f”{location}的天气是极端狂风暴雨天气,超级强度雷电以及超大降雨量” agent = create_agent(     model=ChatTongyi(model=”qwen3-max”),    

大模型学习笔记:Agent智能体 Read More »

大模型学习笔记:RAG项目

RAG即检索、增强和生成,其主要分为2条线: 离线处理:向私有知识库(向量存储)源源不断添加私有文档 向知识库添加来自未来的知识文档(基于模型训练完成时间) 向模型添加私有知识文档 给出模型参考资料,规避模型幻觉(一本正经胡说八道) 在线处理:用户提问会先基于私有知识库做检索,获取参考资料,同步组装新提示词询问大模型获取结果。 在线流程:

大模型学习笔记:RAG项目 Read More »

大模型学习笔记:Vector Stores 向量存储

下图为典型的向量存储应用,即典型的RAG路程: 上图为典型的向量存储应用,即典型的RAG路程。开发设计: 如何文本转向量 创建向量存储,基于向量存储完成: 存入向量 删除向量 向量检索 LangChain内置向量存储功能, 可以基于: InMemoryVectorStore, 完成内存向量存储 Chroma, 外部数据库向量存储 向量存储类均提供3个通用API接口: add_document, 添加文档到向量存储 delete,从向量存储删除文档 similarity_search:相似度搜索 from langchain_chroma import Chroma from langchain_community.embeddings import DashScopeEmbeddings from langchain_community.document_loaders import CSVLoader #Chroma 向量数据库(轻量级) #依赖langchain_chroma,chromadb vector_store = Chroma(     collection_name=”my_collection”,  #集合名称,类型:str,默认”langchain_store”     embedding_function=DashScopeEmbeddings(),  #用于生成向量的嵌入函数,类型:BaseEmbeddings,默认None     persist_directory=”./chroma_db”,  #持久化目录,存放文件夹,类型:str, ) “”” loader = CSVLoader(    

大模型学习笔记:Vector Stores 向量存储 Read More »

OpenClaw一周体验

最近一只大龙虾在科技圈好火,甚至说早已出圈了,各种平时不是科技内容的公众号,也开始说这只无所不能,甚至“成了精的”了的龙虾。我初步用了一周时间,现在记录一下自己的体验。 我对于OpenClaw的理解是赋予了大模型本地电脑的命令执行能力,尤其通过Terminal这个接口,能做很多事情了,而不仅仅是之前聊聊天只是给用户一个建议,真正执行还需要用户自己去做。 首先是安装步骤,这个工具目前还远达不到常见软件的使用便利度,在终端安装并且通过命令行配置真会劝退很多人,后边还涉及模型接入和Skills补充,如果不是工科背景,真挺有挑战的。现在网上安装指导已经多如牛毛了,不是我要记录的重点,我想分享的,是这期间对多个模型不同能力的感受,并且我还是不是完全敢赋予它我本地电脑全部权限,现在我是将其部署在我的服务器上的,主要尝试其一些远程能协助我的功能。 从一开始到现在我相对深入尝试过5个模型:GPT-40, Claude Opus 4.6, Kimi 2.5, Kimi 2.5 Coding, Gemini-3-pro-preview,我在这几个模型中都尝试了这几个问题: 告诉我现在的金价/告诉我北京天气:测试工具联网搜索整合信息的能力; 给我每分钟告诉我一次天气/当前时间:测试工具集合大模型定时任务的效果 一开始用的是GPT-4o,主要是其在我的CoPilot订阅中免费(后来得知只是在VS Code中免费,像在OpenClaw中通过API也不免费),配置好后几轮沟通下来感觉像个智障,完全没有网上帖子说的神乎又神自己去解决问题的能力,而是连基本的能力都不会,我问个天气问不出来,最后给我编了一个,还好比较诚实后来告诉是编的。。。同时我让它给我设个定时任务,每1分钟给我发个消息,也搞不定。感觉如果说给我这样一个助力,我真的不敢用,给我收集信息不敢信的同时,对于提醒也收不到。 然后看OpenClaw官方说最最推荐的模型是Claude Opus 4.6,我订阅的CoPilot也可以使用这个模型,于是我切过去试了相同的问题,真正让我感受到不同的天赋真是不能比,因为是天与地的差别。我问了金价,并且让给我定时报时,真的是一次成功,没有任何的纠结可言,这让我稍微感受到了助理的感觉,同样我的环境没有做任何改变,只是换了一个模型,信息也能推送了,网络也能搜索了,而不像前一位GPT-4o同学,抱怨环境不好,抱怨工具有问题,然后任务没完成的同时,抛回给我一大堆问题让我去给他解决,而Claude Opus 4.6就像是一位很聪明的助力,咔咔咔不废话把任务完成(联网查询金价,通过飞书推送时间),然后顺便说了我的飞书配置有些问题,但是不影响当前的任务已经做完了。这感觉非常像职场上不同风格的下属了,把任务交给能力强的人比如Opus 4.6就很放心,即使中间有不少挑战(比如我配置的飞书有瑕疵),该下属也能灵活应变将其搞定从而完成任务。而把任务交给一个能力欠佳的人比如GPT-4o,推进途径遇到很多麻烦一次又一次回来麻烦领导,最后好多任务完不成(比如定时通知),好不容易完成的一个(比如查询天气),老板也不敢信任,因为那个天气真的是编的。。。 后来我又尝试了Gemini-3-pro-preview,像一个还算聪明,但是很马虎的下属。同样的问题,查询天气一次搞定,但是推送时间上,首先第一次推送到飞书,通道对了,但是给我推送的是欧洲柏林时间,我指出其问题后,时间确实改对了是北京时间了,但是又把这个信息推送到了trace而不是飞书,真是不靠谱。如果是这样的下属,我感觉至少是聪明,马虎的问题还是一定程度有解决的空间的。 最后我还试了Kimi 2.5 和Kimi Code,这两者差异不大,总体靠谱程度感觉介于Claude Opus 4.6和Gemini-3-pro-preview之间。上边两个问题基本OK,除了在时区上有点栽。 总结下来就最聪明的大模型在智能助手上感觉确实到了能有正收益的临界点,一些信息收集整理,真可以交给这位助手来解决。目前我是部署在服务器上,我感觉按照Claude Opus 4.6给我的正反馈,安装在自己个人电脑让其逐步开始帮我处理一些文件整理,材料整备等内容,真的是可以去信赖了。但是如果是GPT-4o我感觉会吓死人的,部署在自己电脑上指不定会出什么幺蛾子。我感觉这真的是像极了职场,老板招聘员工时候一方面很缺人一方面又招不来人,因为很多时候宁缺毋滥,让一个很蠢的人来帮自己做事,作为老板们可能还不如自己做。今天我一直以老板以领导的角度来思考问题,都快差点忘了我却是那个给老板打工的人,努力让自己成为Claude Opus,很很多时候感觉自己是GPT-4o。 在切换多个模型过程中,我还问了新模型有没有记得我对于OpenClaw的一些嘱咐,通过回答可以了解到OpenClaw对于用户个人信息其实就是将其总结然后存在本地的一个md文件中,在新的会话或者换了模型后,这些核心信息也会加载到与大模型沟通的内容中。这个过程是带提炼总结压缩的,尤其是上下文太长的时候,其中可能就会丢失信息,最近新闻提到一个安全专家的邮件都被删了,据说就是由于信息压缩把一些很重要内容搞丢了造成的。 再总结一下费用方面,对于OpenClaw部署,多数人是安装在自己的电脑上,也有一些人可能买了Mac Mini,(确实在把玩Skills发现如果在Mac工作环境下应该体验更好),这块应该投入还好,VPS也不贵,电脑大家都有,即使新买个Mac Mini也是一次性的。关键是大模型费用,真的挺烧Token挺贵的。我的CoPilot订阅是一个月10刀,Claude Opus 4.6是三倍Token用量,也就是说我10刀用100个来往交流就烧没了!事实上也是这样,我差不多用了两天,我的CoPilot就提示超额度了。。。其次我还尝试了Kimi,如果使用moonshot的API订阅的话,基本上每一次对话就是几毛钱的费用,不知道随着使用得越久上下文越长,每一次的沟通就是一个很夸张的费用。后来尝试了Kimi Code 49元/月的订阅,感觉比从moonshot订阅得到的额度大多了,其是按照周用量和频现来要求的,也比CoPilot合理很多。感觉是对于普通OpenClaw用户最合适的选择。 我的一周体验大致总结差不多了,给我的整体感受是这个真的是一个跨度很大的能力跃迁,并且成熟速度惊人OpenClaw几乎一天一更新,感觉用不了多长时间,就能够很大程度上成为普通用户友好的智能助手,投入到每天具体的牛马工作中。我的计划是继续在服务器用一段时间,然后在之后某个时间点将其引入我的个人电脑上,尝试提升我的效率,将一些我一直想做但是没时间做的事情,看看能否交给OpenClaw帮我完成。 大致就先记录到这里啦,如果你也最近对这只龙虾很上头,我们可以多交流交流,分享经验心得一起玩一起玩。

OpenClaw一周体验 Read More »

大模型学习笔记:RAG

Retrieval Augmented Generation: 检索增强生成技术,利用检索外部文档提升生成结果质量。为大模型提供了从特定数据源检索到的信息,以此来修正和补充生成答案。RAG = 检索技术 + LLM提示。 领域知识和私有数据 实时数据 减少生成不确定性 增强数据安全 RAG标准流程由索引(Indexing)、检索(Retriever)和生成(Generation)三个核心阶段组成。 索引阶段:通过处理多种来源多种格式的文档提取其中文本,将其切分成标准长度的文本块(chunk),并进行嵌入向量化(embedding),向量存储在向量数据库(vector database)中。 加载内容 内容提取 文本分割,形成chunk 文本向量化 存向量数据库 检索阶段,用户输入的查询(query)被转化为向量表示,通过相似度匹配从向量数据库中检索出最相关的文本块。 query向量化 在文本向量中匹配出与问句向量相似的top_k个 生成阶段,检索到的相关文本与原始查询共同构成提示词(Prompt),输入大语言模型(LLM),生成精确且具备上下文关联额回答。 匹配出的文本作为上下文和问题一起添加到prompt中 提交给LLM生成答案 模型本质上就是用户输入,模型给出输出,用户能做的就是在输入上做功夫。核心价值: 解决知识时效性问题:接入最新文档,“与时俱进” 降低模型幻觉:模型的回答基于检索到的事实性资料,而非纯靠自身记忆,大幅减少编造信息的概率 无需重新训练模型:相比微调(Fine-tuning), RAG只需更新知识库,成本更低、效率更高  

大模型学习笔记:RAG Read More »

大模型学习笔记:向量

Vector向量就把一段文字的语义信息,转换成一串固定长度的数字列表,让计算机能“看懂”文字的含义并做相似度计算。简单说就是让计算机连接不同的文本是否表达同一个意思。 文本嵌入模型通过深度学习等技术,从文本提取语义特征并映射为固定长度的数字序列。向量嵌入的过程,我们一般选择合适的文本嵌入模型来完成。 text-embedding-v1模型可以生成1536维的向量。生成向量维度越多,就更好的记录文本的语义特征,做语义匹配会更加精准。更多的向量会在计算、存储和匹配过程中,带来更大压力:tradeoff of precise and performance. 向量的匹配通过算法实现,如余弦相似度。向量的数字序列,共同决定了向量在高纬度空间中的方向和长度,而余弦相似度主要就是撇去长度的影响,得到方向的夹角。夹角越小越相似,即方向相同。 余弦相似度:两个向量的点积 / 两个向量模长的乘积 import numpy as np def get_dot(vec1, vec2):     “””     计算两个向量的点积     :param vec1: 向量1     :param vec2: 向量2     :return: 点积结果     “””     if len(vec1) != len(vec2):         raise ValueError(“两个向量的长度必须相同”)    

大模型学习笔记:向量 Read More »

大模型学习笔记:Prompt Engineering 提示词工程

Prompt Engineering 也成为In-Context Prompting, 是指在不更新模型权重的情况下如何与大模型交互以引导其行为以获得所需结果的方法。人工智能领域,Prompt指的是用户给大语言模型发出的指令。 提示词技巧: 详细的描述 让模型充当某个角色 使用分隔符标明输入的不同部分 – 例:用20个字符总结由三引号分割的文本。“”“在此插入文本”“” 对任务指定步骤:对于可以拆分的任务可以尽量拆开,最好能为其指定一系列步骤 – 步骤1:“”“用户输入文本”“”,用一句话总结这段文本,并加上前缀“Summary” – 步骤2:将步骤1中的摘要翻译成英语,并添加前缀“翻译: ” 提供例子:本质类似于few-shot learning。先扔给大模型举例,然后让模型按照例子来输出 – 按照这句评论文本的格式:““”用户输入文本”“”,帮我创造新的样本 基于文本文档:帮助大模型问答,**降低模型“幻觉”**, 经典知识库用法,让大模型使用我们提供的信息来组成答案:- 根据下文中三重引号引起来的文章来回答问题。如果在文章中找不到答案,请写“我找不到答案”, 不要自己造答案。“”“<在此插入文档>”“”“”“<在此插入文档>”“”问题:<在此插入问题> 大模型本身是一种很简单的结构:用户输入,模型输出。不管RAG还是Agent智能体或其他围绕模型的各种复杂的开发工作,本质上都可以简单总结为在提示词上下功夫。 Few-Shot, Zero-Shot思想 Zero-shot Learning(联想),指在训练阶段不存在与测试阶段完全相同的类别,但是模型可以使用训练过的知识来推广到测试集中的新类别上。“零样本”学习。因为模型在训练时从未见过测试集中的新类别,在模型训练和提示词优化中均有体现。 在提示词优化中:用于基于已训练的能力,不提供任何示例,仅通过语言去描述任务的要求、目标和约束,让模型直接生成结果。简单来说就是“用语言定义任务,解放(信任)模型的预训练知识”。 例:请判断“”包围的用户评论中的情感倾向,输出 正面 或 负面。“这款代餐鸡胸肉饱腹感很强,吃起来也不柴,很推荐!” Few-shot Learning (示例)是指少样本学习,当模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,对应的有one-shot learning,单样本学习,也算样本少到为一的情况下的一种few-shot learning from openai import OpenAI import os client = OpenAI(     api_key=os.getenv(“OPENAI_API_KEY”),     base_url=”https://dashscope.aliyuncs.com/compatible-mode/v1″,

大模型学习笔记:Prompt Engineering 提示词工程 Read More »

ROS2学习笔记:Python最小支持Parameters的节点

通过如下命令新建一个package框架: ros2 pkg create –build-type ament_python –license Apache-2.0 python_parameters –dependencies rclpy Python的示例代码为: import rclpy import rclpy.node class MinimalParam(rclpy.node.Node): def __init__(self): super().__init__(‘minimal_param_node’) self.declare_parameter(‘my_parameter’, ‘world’) self.timer = self.create_timer(1, self.timer_callback) def timer_callback(self): my_param = self.get_parameter(‘my_parameter’).get_parameter_value().string_value self.get_logger().info(‘Hello %s!’ % my_param) my_new_param = rclpy.parameter.Parameter( ‘my_parameter’, rclpy.Parameter.Type.STRING, ‘world’ ) all_new_parameters = [my_new_param] self.set_parameters(all_new_parameters) def main(): rclpy.init() node = MinimalParam() rclpy.spin(node) if

ROS2学习笔记:Python最小支持Parameters的节点 Read More »