Blog de Simon🫣
历史归档
文章分类
文章标签
Github
About Me
友链
开往
SimonSun
文章
22
分类
4
标签
37
历史归档
文章分类
文章标签
Github
About Me
友链
开往
LLM

🌱Attention Residuals 残差进化史

LLM
2026-3-20
llm
算法
Attention Residuals 残差进化史

🏄‍♂️MoE 模型的路由重放 → R3

LLM
2026-1-20
llm
算法
论文
MoE 模型的路由重放 → R3

🤭VLM

LLM
2026-1-10
碎笔
VLM

🐧Verl vs AReaL

LLM
2025-12-17
框架
llm
Verl vs AReaL

🗻扫盲 reward hacking 和 熵坍缩

LLM
2025-12-4
llm
算法
扫盲 reward hacking 和 熵坍缩

🗻扫盲 Online / Offline & On-policy / Off-policy

LLM
2025-11-28
llm
算法
扫盲 Online / Offline &  On-policy / Off-policy

🗻扫盲KL散度和交叉熵

LLM
2025-9-29
llm
算法
扫盲KL散度和交叉熵

🗻扫盲 Monte Carlo (MC) 和 Temporal Difference (TD)

LLM
2025-9-15
llm
算法
扫盲 Monte Carlo (MC) 和 Temporal Difference (TD)

💡总结:PPO GRPO GSPO RLOO Loss 分析

LLM
2025-8-6
llm
算法
总结:PPO GRPO GSPO RLOO Loss 分析

🏄‍♂️GRPO → GSPO → DAPO → SAPO

LLM
2025-7-30
llm
算法
GRPO → GSPO → DAPO → SAPO

🐦Agent 框架汇总

LLM
2025-7-4
agent
记录
Framework
Agent 框架汇总

🤔思考:Agent 项目的核心挑战与难点是什么?

LLM
2025-7-4
agent
RAG
Framework
思考:Agent 项目的核心挑战与难点是什么?
12
SimonSun
SimonSun
Internet Malou, LLM Rookie, Bug Maker🤧
文章
22
分类
4
标签
37
最新发布
读A.I. Should Elevate Your Thinking, Not Replace It 有感
读A.I. Should Elevate Your Thinking, Not Replace It 有感
2026-5-9
vibecoding skill 集合使用历程记录
vibecoding skill 集合使用历程记录
2026-5-9
创业灵感挖掘与验证指南
创业灵感挖掘与验证指南
2026-5-9
VLM
VLM
2026-5-9
vibe coding for 前端心路历程
vibe coding for 前端心路历程
2026-5-7
vibe coding 一年小结
vibe coding 一年小结
2026-4-15
公告
🙌README🙌
🤯There is nothing left
in my right brain,
🤯and there is nothing right
in my left brain...
⭐I wish you every success⭐
 
2023-2026SimonSun.

Blog de Simon🫣 | Internet Malou, LLM Rookie, Bug Maker🤧

Powered byNotionNext 4.9.5.2.