From 2838ae93304d005766603d60a81e443220bba6d0 Mon Sep 17 00:00:00 2001 From: leto245 Date: Wed, 17 Dec 2025 16:42:55 +0800 Subject: [PATCH 1/2] =?UTF-8?q?Create=20[2026]=20=E4=B8=8A=E6=B5=B7AI=20La?= =?UTF-8?q?b&=E4=B8=8A=E4=BA=A4=E5=A4=8D=E6=97=A6=E6=B5=99=E5=A4=A7?= =?UTF-8?q?=E8=81=94=E5=9F=B9PhD/=E5=AE=9E=E4=B9=A0=E7=94=9F=20=E5=88=98?= =?UTF-8?q?=E4=B8=9C=E7=91=9E?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...\237 \345\210\230\344\270\234\347\221\236" | 115 ++++++++++++++++++ 1 file changed, 115 insertions(+) create mode 100644 "\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236" diff --git "a/\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236" "b/\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236" new file mode 100644 index 0000000..ca20a52 --- /dev/null +++ "b/\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236" @@ -0,0 +1,115 @@ +# 上海 AI Lab × 上交 / 复旦 / 浙大 联合培养博士生招生 +## 方向:LLM / MLLM 安全与可信(AI Safety & Trustworthiness) + +--- + +## 导师简介 + +**刘东瑞** +上海人工智能实验室(Shanghai AI Lab)青年科学家 +上海交通大学博士 +个人主页:https://shenqildr.github.io/ + +主要从事 **AI 安全可信(AI Safety & Trustworthiness)** 研究,关注大语言模型(LLM)与多模态大模型(MLLM)在真实应用场景下的安全性、鲁棒性与对齐问题。研究路线以**内生安全**为核心,强调通过理解与调控模型内部机理提升模型性能与安全性。 + +参与并支持 **SafeWork-R1、SafeWork-F1** 等项目,在安全评测、攻防、对齐与可解释性等方向发表多项研究成果。 + +**代表性学术成果(部分):** +- CVPR 2024 Best Paper Award Candidate(Top 0.2%) +- ACL 2025 Outstanding Paper Award(Top 0.3%) +- ICLR 2025 Oral(Top 1.8%) +- AAAI 2026 Oral(Top 4%) +- 多篇 ACL 2025 Oral(Top 2%) +- NeurIPS / EMNLP 等顶级会议论文 + +--- + +## 招生类型 + +- **联合培养博士生(PhD)** + - 联培高校:上海交通大学 / 复旦大学 / 浙江大学 +- **长期实习生**(优秀者可转联培博士) +- **全职算法工程师 / 研究员** + +--- + +## 研究方向 + +包括但不限于: + +- 大语言模型(LLM)安全与对齐 +- 多模态大模型(MLLM)安全风险分析 +- Jailbreak / Prompt Injection 攻击与防御 +- 模型安全评测、鲁棒性分析与安全边界建模 +- 可解释性(XAI)与模型内部机理分析 +- 智能体(Agent)安全与极端风险 + +--- + +## 为什么加入我们 + +### 1. 清晰且可持续的成长路径 +- 联培博士生主要从**长期实习、表现优秀的同学中选拔** +- 过往实习生去向包括:字节跳动、腾讯、上海 AI Lab + 以及北京大学、新加坡、加拿大、美国等高校继续深造 + +### 2. 稳定的科研产出环境 +- 组内长期实习同学多数以**一作或共同一作**发表 / 投稿顶会论文 +- 多位同学在此完成**首篇顶会论文或首篇 Oral** +- 持续在 AAAI / ICLR / NeurIPS / ACL / EMNLP 等会议发表成果 + +### 3. 深度且负责任的科研指导 +- 从研究选题、实验设计到论文写作与投稿,全程参与指导 +- 鼓励独立课题探索,同时提供充分支持 +- 组内形成良好的互助科研氛围 + +--- + +## 近期部分研究方向与成果 + +### Jailbreak / 安全漏洞 +- *LLMs know their vulnerabilities: Uncover Safety Gaps through Natural Distribution Shifts* + ACL 2025 Outstanding Paper Award +- *The Devil Behind Mask: An Emergent Safety Vulnerability of Diffusion LLMs* + +### 可解释性与对齐(XAI & Alignment) +- *REEF: Representation Encoding Fingerprints for Large Language Models* + ICLR 2025 Oral +- *The Tug of War Within: Mitigating the Fairness-Privacy Conflicts in LLMs* + ACL 2025 Oral +- *X-Boundary: Establishing Exact Safety Boundary to Shield LLMs from Multi-Turn Jailbreaks* + EMNLP 2025 Findings +- *Demystifying Reasoning Dynamics with Mutual Information* + NeurIPS 2025 + +### Agent Safety +- *RiOSWorld: Benchmarking the Risk of Multimodal Computer-Use Agents* + NeurIPS 2025 +- *Your Agent May Misevolve: Emergent Risks in Self-Evolving LLM Agents* + +--- + +## 我们希望你具备 + +- 能保证 **连续 6 个月及以上** 的科研投入 +- 对 AI 安全 / 大模型研究有真实兴趣 +- 具备基础 AI 与编程能力(Transformer、深度学习、PyTorch 等) +- 硕士 / 博士同学申请需**事先征得本校导师同意** + +--- + +## 申请方式 + +📮 **申请邮箱**: +**drliu96@sjtu.edu.cn** + +📌 **邮件主题**: +`实习生 / 全职 / 联培博士 - 姓名` + +📎 **邮件附件**: +- 个人简历 +- 成绩单 +- 简要自我介绍(研究兴趣 / 相关经验) + +我会认真阅读每一封邮件,并尽快回复。 +期待与你一起,探索 AI 安全背后的**真问题**。 From 2276911a97d2a616c211c30bdd60a0e3d847f85f Mon Sep 17 00:00:00 2001 From: leto245 Date: Wed, 17 Dec 2025 16:43:56 +0800 Subject: [PATCH 2/2] =?UTF-8?q?Rename=20[2026]=20=E4=B8=8A=E6=B5=B7AI=20La?= =?UTF-8?q?b&=E4=B8=8A=E4=BA=A4=E5=A4=8D=E6=97=A6=E6=B5=99=E5=A4=A7?= =?UTF-8?q?=E8=81=94=E5=9F=B9PhD=20=E6=8B=9B=E7=94=9F=20=E5=88=98=E4=B8=9C?= =?UTF-8?q?=E7=91=9E=20to=20[2026]=20=E4=B8=8A=E6=B5=B7AI=20Lab&=E4=B8=8A?= =?UTF-8?q?=E4=BA=A4=E5=A4=8D=E6=97=A6=E6=B5=99=E5=A4=A7=E8=81=94=E5=9F=B9?= =?UTF-8?q?PhD=20=E6=8B=9B=E7=94=9F=20=E5=88=98=E4=B8=9C=E7=91=9E=E8=80=81?= =?UTF-8?q?=E5=B8=88?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ... \345\210\230\344\270\234\347\221\236\350\200\201\345\270\210" | 0 1 file changed, 0 insertions(+), 0 deletions(-) rename "\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236" => "\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236\350\200\201\345\270\210" (100%) diff --git "a/\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236" "b/\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236\350\200\201\345\270\210" similarity index 100% rename from "\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236" rename to "\346\213\233\347\224\237\344\277\241\346\201\257/[2026] \344\270\212\346\265\267AI Lab&\344\270\212\344\272\244\345\244\215\346\227\246\346\265\231\345\244\247\350\201\224\345\237\271PhD \346\213\233\347\224\237 \345\210\230\344\270\234\347\221\236\350\200\201\345\270\210"