Blog de Simon🫣
历史归档
文章分类
文章标签
Github
About Me
友链
开往
SimonSun
文章
22
分类
4
标签
36
历史归档
文章分类
文章标签
Github
About Me
友链
开往
LLM

🪸强化学习(3) DPO

LLM
2025-6-25
RM
llm
强化学习(3) DPO

🚄VLLM 部署常用参数解释&脚本

LLM
2025-3-18
推理
llm
VLLM 部署常用参数解释&脚本

🪸PPO(1)算法详解

LLM
2025-2-28
RM
llm
PPO(1)算法详解

🕍LLM训练数据格式

LLM
2025-1-16
数据
llm
LLM训练数据格式

🪸PPO(0)强化学习基础

LLM
2024-12-23
RM
llm
PPO(0)强化学习基础

🛻自定义special_tokens

LLM
2024-12-16
llm
model
自定义special_tokens

🏍️deepspeed训练显存消耗

LLM
2024-8-28
分布式
deepspeed
train
deepspeed训练显存消耗

💬CO-STAR Prompt

LLM
2024-8-26
prompt
llm
CO-STAR Prompt

🕸️Nvidia DGX-1 拓扑结构

LLM
2024-8-26
分布式
Nvidia DGX-1 拓扑结构

🖼️多模态入门记录

LLM
2024-8-26
多模态
llm
多模态入门记录
12
SimonSun
SimonSun
Internet Malou, LLM Rookie, Bug Maker🤧
文章
22
分类
4
标签
36
最新发布
VLM
VLM
2026-5-7
vibe coding for 前端心路历程
vibe coding for 前端心路历程
2026-5-7
读A.I. Should Elevate Your Thinking, Not Replace It 有感
读A.I. Should Elevate Your Thinking, Not Replace It 有感
2026-4-28
vibe coding 一年小结
vibe coding 一年小结
2026-4-15
token 焦虑症
token 焦虑症
2026-4-13
Attention Residuals 残差进化史
Attention Residuals 残差进化史
2026-4-10
公告
🙌README🙌
🤯There is nothing left
in my right brain,
🤯and there is nothing right
in my left brain...
⭐I wish you every success⭐
 
2023-2026SimonSun.

Blog de Simon🫣 | Internet Malou, LLM Rookie, Bug Maker🤧

Powered byNotionNext 4.9.5.2.