liuliAI

我的梦想
不是每个人都应该像我这样去建造一座水晶大教堂，但是每个人都应该拥有自己的梦想，设计自己的梦想，追求自己的梦想，实现自己的梦想。梦想是生命的灵魂，是心灵的灯塔，是引导人走向成功的信仰。有了崇高的梦想，只要矢志不渝地追求，梦想就会成为现实，奋斗就会变成壮举，生命就会创造奇迹。——罗伯·舒乐
听听音乐
                            
                            从DPO、PPO、GRPO到DAPO再到GSPO
                        
                                # 一、PPO 解析
为了实现稳定的 RLHF，OpenAI 构建了 PPO（Proximal Policy Optimization，近端策略优化）机制，加入了 Critic、CLIP 操作和 Reference Model，在保证 策略
                            
                                2025-09-03
                            
                                    LLM
                                
                            LLM
                        
                            基于大语言模型（LLM）的智能体（Agent）构建指南
                        
图1：LLM Agent核心架构示意图
# 一、LLM Agent 技术解析
# 1.1 什么是智能体（Agent）？
在人工智能领域，智能体（Agent）是指能够感知环境并自主采取行动实现目标的智能系统。具有主观能动性，实现从 “计划”
                            
                                2024-10-03
                            
                                    Agent
                                
                            LLM
                        
                            Agent
                        
                            Datawhale AI：大模型应用全栈开发task1
                        
                                大模型应用全栈开发task1---智慧旅游Agent
和队友开发了一个智慧旅游 Agent 产品
详情可见lhttps://github.com/SongWWWWWW/Agent4travel/tree/main

为什么会有这个项目？
如
                            
                                2024-08-08
                            
                                    大模型
                                
                            大模型
                        
                            全栈开发
                        
                            Gradle、Maven、Nacos、Redis、MySQL下载安装
                        
                                心累，又要干项目了 T_T
Gradle下载
首先去官网下载，https://gradle.org/releases/，我安装的是8.9版本
将 Gradle 解压到一个没有中文没有空格的路径下，解压完成后，配置环境变量
此电脑→系统属性→
                            
                                2024-08-02
                            
                                    Java开发
                                
                            Windows
                        
                            大数据
                        
                            Java开发
                        
                            Gradle
                        
                            Maven
                        
                            Nacos
                        
                            Redis
                        
                            MySQL
                        
                            Linux(Ubuntu)服务器无法使用ssh登陆
                        
                                Linux(Ubuntu)服务器无法使用ssh登陆
心累，每天都被服务器包围 T_T 

首先 ping 服务器地址，如果不可以，参照上篇博客解决方案
如果可以 ping 通，但是使用 ssh 无法登陆，显示 connection time
                            
                                2024-07-28
                            
                                    Linux
                                
                            Linux
                        
                            教程
                        
                            服务器
                        
                            SSH
                        
                            Linux(Ubuntu)服务器网络问题,甚至网关都不能ping通
                        
                                Linux(Ubuntu)服务器网络问题,甚至网关都不能ping通
心累，每天都被服务器包围 T_T 

首先使用命令 route -n  查看服务器网关（第一行），然后 ping 网关，如果正常表示服务器可以正常上网，使用 pip ins
                            
                                2024-07-27
                            
                                    Linux
                                
                            Linux
                        
                            教程
                        
                            服务器
                        
                            网关
                        
                            DNS
                        
                            IPv4
                        
                            Linux(Ubuntu)服务器重装NVIDIA驱动
                        
                                心累，每天都被服务器包围 T_T 

Linux(Ubuntu)服务器重装NVIDIA驱动
下载显卡驱动
准备 gpu 驱动和 CUDA 软件包，下载显卡驱动，下面是下载显卡驱动链接
https://www.nvidia.cn/driver
                            
                                2024-07-27
                            
                                    Linux
                                
                            Linux
                        
                            教程
                        
                            服务器
                        
                            NVIDIA
                        
                            驱动
                        
                            Linux(Ubuntu)服务器RAID磁盘阵列扩充硬盘
                        
                                心累，每天都被服务器包围 T_T 

Linux(Ubuntu)服务器RAID磁盘阵列扩充硬盘
首先关机，切断电源，把买好的硬盘插上去

开机，等待一会，根据提示使用  Ctrl+R   快捷键进入阵列卡里，并使用  ↓  选择刚刚插入的硬
                            
                                2024-07-26
                            
                                    Linux
                                
                            Linux
                        
                            教程
                        
                            服务器
                        
                            RAID磁盘阵列
                        
                            Ubuntu
                        
                            继RWKV、Mamba、KAN之后号称超越Transformer的线性架构TTT又来了
                        
                                继RWKV、Mamba、KAN之后号称超越Transformer的线性架构TTT又来了
最早从 23 年 5 月的RWKV(RKWV 系列从 V1 更新到 V6，并且作者确实认真做了不少事情的)，再到去年 12 月的Mamba，到今年 4 
                            
                                2024-07-20
                            
                                    论文
                                
                            RWKV
                        
                            Mamba
                        
                            KAN
                        
                            TTT
                        
                            线性架构
                        
                            RCL实验室Linux服务器操作手册
                        
                                RCL实验室Linux服务器操作手册
仅供东北大学机器人科学与工程学院机器人认知实验室（Robot Cognition Lab，RCL）成员使用。
RCL 实验室官网见此处，感兴趣获取更多详细信息。
账号申请方法
联系目前服务器管理员QQ

                                2024-06-23
                            
                                    Linux
                                
                            Linux
                        
                            教程
                        
                            服务器
                        
                            Cantor：Inspiring Multimodal Chain-of-Thought of MLLM
                        
                                Cantor: Inspiring Multimodal Chain-of-Thought of MLLM
本文是论文Cantor: Inspiring Multimodal Chain-of-Thought of MLLM的阅读笔记和个人
                            
                                2024-06-19
                            
                                    论文
                                
                            CoT
                        
                            多模态
                        
                            大模型
                        
                            Multimodal Large Language Model 总结
                        
                                Multimodal Large Language Model 总结
由于最近论文工作需求，本文以总结的形式梳理了近期比较有代表性的MLLM, 推荐有基础后再阅读
Revolution of Visual-Language Adapter

                                2024-06-17
                            
                                    论文
                                
                            多模态大模型