学术与生活兴趣
我对改进物理竞赛和进行深度学习/机器学习研究感兴趣。
高中参加物理竞赛并在IPhO获得金牌后,我一直致力于普及物理竞赛的教育资源,因此努力创办了CPHOS。
惊叹于我在大学学到的人工智能技术的最新进展,我参与了许多与深度学习/机器学习相关的研究。
研究兴趣
我的研究兴趣广泛涵盖深度学习和机器学习领域。
对于深度学习/机器学习的应用,我对LLM的各个方面衍生应用感兴趣,包括多智能体研究和多模态语言模型。
对于深度学习的物理学和物理学的深度学习/机器学习,我对大型神经网络的物理学感兴趣,例如各个领域的Scaling Law及其解释和可扩展模型。此外,我相信物理相关问题(例如物理竞赛的理论和实验测试)是评估AI系统推理能力、物理理解能力和真实世界建模能力的优秀基准。
|
精选论文与预印本(按时间顺序)
(* 表示共同一作, ^ 表示共同通讯)
|
Intrinsic Entropy of Context Length Scaling in LLMs
Jingzhe Shi*,
Qinwei Ma*,
Hongyi Liu*,
Hang Zhao^,
Jeng-Neng Hwang,
Lei Li^
ICLR 2026
Code
/
arXiv
我们从内在空间(Intrinsic Space)的角度解释了上下文长度的缩放规律,通过自然语言和合成数据集的实验验证了理论假设和推导。
我们发现从LLM中间状态测量的内在熵(Intrinsic Entropy)与下一个token预测损失呈线性关系,这可能是一个值得探索的有趣现象,并可能暗示了稀疏表示的成功。
|
|
PRISM-Physics: Causal DAG-Based Process Evaluation for Physics Reasoning
Wanjia Zhao*,
Qinwei Ma*,
Jingzhe Shi*,
Shirley Wu,
Jiaqi Han,
Yijia Xiao,
Si-Yuan Chen,
Xiao Luo,
Ludwig Schmidt,
James Zou
ICLR 2026
Project Page
/
arXiv
我们提出了Prism-Physics,一个具有基于DAG的评分策略和基于规则的方程等价比较的物理竞赛问题数据集,以细粒度的过程评分方式评估LLM的物理推理能力。
我们的评分框架和方法旨在适应其他具有数学推理过程的数据集。
|
|
Physics Supernova: AI Agent Matches Elite Gold Medalists at IPhO 2025
Jiahao Qiu*,
Jingzhe Shi*,
Xinzhe Juan,
Zelin Zhao,
Jiayi Geng,
Shilong Liu,
Hongru Wang,
Sanfeng Wu,
Mengdi Wang
NeurIPS 2025 LLM Eval Workshop (Oral), NeurIPS 2025 LAW Workshop
Code
/
arXiv
我们提出了一个基于智能体的框架来解决国际物理奥林匹克问题。
我们在IPhO 2025理论题上进行了实验,验证了基于智能体方法的有效性。
|
|
Scaling Law for Time Series Forecasting
Jingzhe Shi*,
Qinwei Ma*,
Huan Ma,
Lei Li
NeurIPS 2024
Code
/
arXiv
/
OpenReview
我们提出了时间序列预测的Scaling Law理论框架,考虑了回看窗口以及数据集大小和模型大小。
我们进行了实验来验证我们提出的理论和假设。
我们的关键理论和实验发现是,最优回看窗口确实存在,并且随着数据集大小的增加而增加,这要求在提出新的时间序列预测模型时进行更公平的比较。
|
|
CHOPS: CHat with custOmer Profile Systems for Customer Service with LLMs
Jingzhe Shi,
Jialuo Li,
Qinwei Ma,
Zaiwen Yang,
Huan Ma,
Lei Li
COLM 2024
Code
/
arXiv
/
OpenReview
我们提出了CHOPS,一个LLM智能体,旨在通过结合小型和大型LLM来高效访问用户信息、与现有系统交互,并提供准确、安全的响应。使用我们在同一工作中提出的CPHOS数据集进行验证,CHOPS展示了增强或替代人工客户服务的潜力。
|
|
Large Trajectory Models are Scalable Motion Predictors and Planners
Qiao Sun,
Shiduo Zhang,
Danjiao Ma,
Jingzhe Shi,
Derun Li,
Simian Luo,
Yu Wang,
Ningyi Xu,
Guangzhi Cao,
Hang Zhao
arXiv 2023
Code
/
arXiv
我们利用NLP中成功的骨干网络进行轨迹预测,在多个数据集上展示了可扩展性,并在Nuplan数据集上达到了最先进的性能。
我负责解码器部分。我利用DDPM在关键点空间中生成轨迹,以捕获未来轨迹的多模态分布。
|
社会工作经验
 |
CPHOS
2020.12 - Present
共同创始人,前技术组负责人,理事会成员
CPHOS是一个非盈利的学术组织,致力于为全国高中生提供免费的物理竞赛模拟平台。
CPHOS成立于2020年底,由10人(包括我自己)创办,现在有100多名成员。1000多名来自200多所高中的学生参加了CPHOS举办的大部分奥林匹克竞赛。
我领导技术组开发支持在线奥林匹克竞赛的工具,并进行有趣的研究,包括CHOPS项目。
|
 |
Optiver
2024.07-2024.08
量化交易实习生,Optiver上海办公室
Optiver是一家全球领先的做市商。
|
代表性奖项和奖学金
(完整列表可在简历中找到:CV)
|
2023&2024: 清华大学科技创新奖学金。
2021: 清华大学新生一等奖学金。
2021: IPhO金牌🏅(IPhO 2021), 排名全球第十。
2021: 在全国中学生物理竞赛中,经过一系列选拔,成为5位中国国家队队员之一;这一过程中获得了一系列省级、国家级物理竞赛一等奖(金牌)(从约66万名CPhO第一轮参赛者中选出)。
|
语言和技能
|
语言: 中文(母语), 英语(TOEFL: 113; R30,L28,S26,W29; 2024年11月成绩),日语(日常对话)。
编程语言: Python, C/C++, etc.
工具: Git, LaTeX, SQL, etc.
|
公共服务
|
ICLR 2025 & 2026, COLM 2025, NeurIPS 2025 审稿人。
IPhO 2022(第52届国际物理奥林匹克)阅卷员。那年IPhO在瑞士举行,但由于疫情,IPhO不得不邀请额外的阅卷员。我受邀并作为线上阅卷员完成了我的工作,通过线上会议与我的阅卷伙伴讨论,并与来自世界各国和地区的队长进行答辩。我感到非常幸运,能够在作为选手参加并获得金牌仅一年后,作为阅卷员为这项顶级物理奥林匹克做出贡献。
|
This homepage is designed based on Jon Barron's homepage and deployed on GitHub Pages. Last updated: Apr, 2025.
© 2025 Jingzhe Shi
|
|