十分钟全面了解金元
🏫 教育背景
🎓 上海交通大学硕士学位 2021.09-2024.03
🎓 上海交通大学学士学位 2017.09-2021.06
💼 实习经历
上海证券交易所技术公司 2022.08-2023.03
上海又为智能科技有限公司 2020.07-2020.09
🔍 研究经历
研究方向1: 大语言模型微调及应用 2023.01-至今
针对大模型复杂推理能力的某指令微调方法
项目摘要
目前有投稿计划,因此暂不提供背景介绍和具体细节。
- 项目时间:2023.05-今
- 项目内容:设计了一种高质量复杂推理数据集的自动化生成框架,并基于
LoRA
对流行的开源大语言模型进行指令微调
。 - 指导教师:赵海 教授
- 个人贡献:第一作者
- 关键词:大语言模型,思维链,复杂推理,指令微调
研究方向2: 自然语言处理问答系统 2021.02-2022.12
针对开放域文章检索的句级感知对比学习
项目摘要
通过对比学习训练密集的段落表示已经被证明对于开放领域段落检索(ODPR)非常有效。现有的研究侧重于通过改进负采样策略或额外的预训练来进一步优化。然而,这些研究在捕捉由于不适当的建模粒度而导致内部表示冲突的段落方面仍然是未知的。具体而言,根据我们的观察,一个段落可以由多个语义上不同的句子组织,将这样的段落建模为统一的密集向量并不是最优的。
因此,本文提出了一个基于较小粒度(上下文句子)的精细模型,以减轻相关的冲突。具体而言,我们引入了一种段落内负采样策略,以鼓励在同一个段落中生成多样化的句子表示。在三个基准数据集上的实验验证了我们方法的有效性,特别是在冲突严重的数据集上。广泛的实验证明了我们方法在数据集之间具有良好的可转移性。
- 项目时间:2021.07-2021.10
- 项目内容:我们提出了一个基于
较小粒度(上下文句子)
的精细模型,以减轻相关的冲突。具体而言,我们引入了一种段落内负采样
策略,以鼓励在同一个段落中生成多样化的句子表示
。在三个基准数据集上的实验验证了我们方法的有效性,特别是在冲突严重的数据集上。广泛的实验证明了我们方法在数据集之间具有良好的可转移性
。 - 指导教师:赵海 教授
- 个人贡献:第三作者,论文发表在 ACL2022
- 相关链接:论文 | 代码
- 关键词:开放域段落检索,对比学习,段落内负采样,可转移性
- 论文引用: Bohong Wu, Zhuosheng Zhang, Jinyuan Wang, and Hai Zhao. 2022. Sentence-aware Contrastive Learning for Open-Domain Passage Retrieval. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 1062–1074, Dublin, Ireland. Association for Computational Linguistics.
针对ASI攻击的解耦合段落匹配方法
项目摘要
最近,预训练的上下文化语言模型(PrLMs)在提升各种自然语言理解系统的性能方面取得了显著的成功。然而,有意制作的对抗样本仍然可以欺骗PrLMs,并导致其做出错误的预测。对抗性句子插入(ASI)是对抽取式机器阅读理解(MRC)任务最具挑战性的攻击方法之一,它攻击了上下文化语言嵌入,并导致有偏见的上下文理解。现有的通用防御方法在传递性方面存在问题,然而很少有研究致力于解决这种威胁。
本文提出了一种针对ASI攻击的解耦合段落匹配(DPM)方法,采用两阶段框架。实验结果表明,与对抗训练方法相比,DPM具有良好的性能,并且对不同的ASI策略具有较强的传递性。
- 项目时间:2021.10-2022.02
- 项目内容:本文提出了一种
针对ASI攻击
的解耦合段落匹配(DPM)方法,采用两阶段框架。实验结果表明,与对抗训练方法相比,DPM具有良好的性能,并且对不同的ASI策略具有较强的传递性。 - 指导教师:赵海 教授
- 个人贡献:第一作者
- 论文链接:暂无
- 关键词:上下文语言模型,抽取式阅读理解,对抗性句子插入
基于上下文语言模型的机器阅读理解系统及优化
项目摘要
近年来,随着深度学习的蓬勃发展,基于Transformer模型的深度预训练上下文语言模型(CLM)逐渐成为NLP领域的主流编码器。深度预训练CLM在文章理解方面有较好的表现,目前的阅读器在文章阅读和语义推理方面已经足够优秀。然而,对MRC系统的错误回答进行研究之后,我们发现阅读器有时会给出一些语义上完全正确,但形式上部分正确的答案。
因此,我们认为在现有的评估体系下,MRC系统的性能很可能并没有被充分发挥出来。在本课题中,我们提出了一种基于深度预训练CLM的多模块化的MRC系统,它针对特定数据集的回答风格进行学习,以更好发挥阅读器的性能。在SQuAD2.0任务上,六种深度预训练CLM的实验结果证明我们提出的MRC系统设计合理,并且系统性能显著超过同型号的2020年的冠军系统Retro-Reader。
研究方向3: 深度学习相关应用 2019.02-2022.03
基于脑电信号的情绪识别中的跨对象域适应研究
项目摘要
情绪识别在许多精神障碍的诊断和治疗以及情感计算中起着重要作用。脑电图 (EEG) 是最常用的生理信号之一,已被证明是一种可靠且合适的情绪识别工具。然而,受试者之间的个体差异和脑电图的非平稳特性限制了情感脑机接口在现实世界应用中的推广。
在本文中,我们研究了几种现有的情绪识别与域适应方法。 此外,我们提出了一种针对基于 EEG 的情绪识别定制的对抗性自动编码器,这在计算机视觉领域非常有效。与上述方法相比,我们提出的模型在 SJTU 情绪脑电数据集 (SEED) 上平均达到了 75.6% 的准确率和最低的 (0.0068) 标准差。
基于图形拓扑和文章检索的链接预测方法
项目摘要
链接预测是预测网络中两个实体之间是否存在链接的问题,这对于挖掘和分析网络的演化具有重要意义。近年来,链接预测的挑战在许多领域引起了广泛关注,例如预测社交网络中的用户关系和预测推荐系统中最有可能选择的项目。在过去的几十年里,链接预测在特征提取和预测器设计方面取得了巨大突破。
在本文中,我们建议使用最先进的(SOTA)深度学习方法来解决链接预测问题,包括图卷积、预训练语言模型(PrLM)和段落检索领域的双编码器框架。除此之外,我们具有提取特征的传统机器学习模型在 Kaggle 排行榜上获得了第 4 名。 我们的代码已开源。
- 项目时间:2022.03-2022.04
- 项目内容:在本文中,我们使用最先进的(SOTA)深度学习方法来解决链接预测问题,包括图卷积、预训练语言模型(PrLM)和段落检索领域的双编码器框架。除此之外,我们具有提取特征的传统机器学习模型在 Kaggle 排行榜上获得了第 4 名。 我们的代码已开源。
- 指导教师:Michalis Vazirgiannis 教授
- 个人贡献:第一作者,负责基于文章检索的链接预测
- 论文链接:
- 关键词:链接预测、引文网络、图卷积、段落检索、逻辑回归
基于卷积神经网络的高能粒子径迹辨识
项目摘要
在震荡实验中发现发现中微子的质量之后,寻找无中微子双贝塔衰变(NLDBD)被认为是目前探索中微子性质最有希望的技术。由上海交通大学发起的PandaX-III期实验在中国锦屏山地下实验室(CJPL)搭建了一个包含200kg纯度为90%的Xe-136浓缩气体的高压气体时间投射室(TPC),用来检测Xe-136的无中微子双贝塔衰变现象。
本文基于PandaX-III实验,主要研究TPC内像素读出与条读出方式对于信号辨识的影响,以期为识别无中微子双贝塔衰变径迹的实践提供参考。我们使用蒙特卡洛模拟法对PandaX-III探测器中的TPC进行理想化建模,分别采用条读出和像素读出的方式进行仿真,然后采用主成分分析法来进行降维,并将更多信息保存在二维空间用于模型训练与实验对比。借助深度学习的方法,我们发现包含更多信息的像素读出方式可以提高模型的准确性,然而条读出的预测结果对于信号的识别更具优势。
- 项目名称:PandaX-III实验中读出精度对Xe-136无中微子双贝塔衰变识别的影响
- 项目时间:2019.10-2021.02
- 项目内容:在本文中,我们使用蒙特卡洛模拟法对PandaX-III探测器中的TPC进行理想化建模,分别采用条读出和像素读出的方式进行仿真,然后采用主成分分析法来进行降维,并将更多信息保存在二维空间用于模型训练与实验对比。借助深度学习的方法,我们发现包含更多信息的像素读出方式可以提高模型的准确性,然而条读出的预测结果对于信号的识别更具优势。
- 指导教师:王少博 副教授
- 个人贡献:队长,负责数据处理、模型训练和数据可视化
- 论文链接:
- 关键词:无中微子双贝塔衰变,PandaX-III,像素读出,PCA,机器学习
基于注意力机制的单图像人群计数和密度估计
项目摘要
估计人群密度长期以来一直是计算机视觉领域的一项具有挑战性的任务。 然而,已经被证明有效的注意力机制和可变形卷积在该领域很少使用。
在本研究中,我们在我们提出的网络中引入了基于注意力机制的注意力生成网络以及基于多列可变形卷积层的密度估计网络。 结果表明,估计精度和鲁棒性都有显着提高。 我们的工作表明注意力机制和可变形卷积在人群密度估计中是有效的。
🔧项目经历
情况简介
根据交大中法学院的课程设置,金元在本科阶段已完成三语课程248学分
(接近双倍交大CS本科生学分),硕士阶段已完成55学分
(接近双倍交大CS硕士学分)的中法工程师课程。金元勤奋好学,在三语环境下成绩斐然,先后两次获得上海交通大学本科优秀奖学金
、一次交大中法学院优秀学业奖学金
和两次上海交通大学研究生奖学金
。面对中法工程师培养体系巨大的学业压力和高期望,金元善于自我调节、自我管理和自我激励。金元不仅以优异成绩完成了学业,也培养了丰富的项目经历。
自动系统控制
- 项目名称:基于自动系统控制的狭窄空间泊车 |
- 项目内容: 在本文中,我们采用具有
模型预测控制 (MPC)
和状态空间建模方法
的两相混合控制策略。我们混合控制
的成功进一步鼓励我们通过训练基于虚拟雷达系统的智能代理,将深度强化学习 (DRL)
应用于此问题。
K8S集群部署
- 项目名称:高可靠K8S集群部署及实践 |
- 项目内容:基于交大云平台,搭建了一个具有三个节点的高可靠性K8S集群,并对外提供WordPress服务。
云计算
- 项目名称:云计算
- 项目内容:本项目包含三个独立的子项目,分别为:
统计测试
- 项目名称:基于 Covid-19 的数据分析 |
- 项目内容:基于15个国家和地区的公开新型冠状病毒肺炎死亡统计数据,本报告采用
主成分分析法(PCA)
、相关因子分析(FAC)
和辨别因子分析(DFA)
方法,研究Covid-19疫情的死亡率、人群年龄分布和人群性别分布之间的潜在关系。在此背景下,本报告采用估计测试
、充分性测试
以及独立性测试
等统计学测试方法,尝试确定部分数据的内生分布和分布之间的相关性。
物联网测试
编译器设计
处理器设计
数字信号处理
📸 社会活动
情况简介
课余时间,金元怀着对公益事业的热忱投身于公益组织
和社会活动
,认识世界的同时也进一步认识自己。2017年以来,他曾任职于上海交通大学青志队、上海交通大学学生体育总会、上海交大巴黎卓越工程师学院青志队,以及部分校园社团,在学生组织中锻炼自己的责任意识和工作能力。 校园之外,金元逐渐从青年公益活动的参与者
成长为专业热情的青年教练
,以专业的教练思维引导他人自我探索,用自己的热情与热爱来影响给更多的青年。
上海交通大学学生工作
学生工作参与者
2018年3月-2019年3月,金元在上海交通大学青年志愿者服务总队担任事物与协调中心主任助理
。在此期间,他致力于让更多的大学生了解并参与志愿者活动,并发起团队建设活动,增强青志队成员团结和集体意识。2017年10月到2018年10月,金元担任上海交通大学学生体育总会摄影部副部长
,在此期间,他多次带领团队参与拍摄上海交通大学的重大体育赛事,并负责后期处理和新闻推送。

学生工作负责人
对学生工作的热爱与热忱使金元在工作中认真负责、表现优秀,得到了广泛的认可。2018年7月,金元曾担任2018世界大学生赛艇锦标赛组委会志愿者负责人
,带领160位志愿者在赛事期间为24个国家和地区的代表队提供服务与支持,协调解决各国代表队赛事问题;协助赛事组委会进行车辆调度,为超过400名裁判及运动员提供超过100次接送机服务。2018年8月,金元曾担任上海交通大学暑期实践重点实践团副团长
,表现突出,荣获“暑期社会实践先进个人”
称号。

校级十佳志愿者
2017-2018学年,金元参加校内志愿者活动十余次,累计学生工作超过1000小时,被评为上海交通大学“十佳志愿者”
。

学生班主任
2021年9月至今,金元担任上海交通大学F2126101班班主任,所带班级获得校级“活力班团”一等奖、团日活动校级一等奖,多次登上校级院级公众号。推送1 | 推送2 | 推送3

青年公益组织
青年活动参与者
秉持对“点燃1%,影响99%”的青年公益理念的认同,金元加入了赋启青年公益组织
,在这里遇到了一群热情温暖的青年伙伴。从2018年12月起,金元陆续参加了赋启青年组织的Diggers掘行中国第33期青年领袖训练营
、JOBinn第11季职涯加速营
、第13期赋启青年黑衣人公益教练进阶训练营
,逐渐从腼腆含蓄的学员成长为优秀、专业、乐于奉献、饱含热情、勇于挑战、永远保持开放心态的青年教练
,实现了从青年公益活动的参与者到影响者
的身份转变和能力提升。

青年活动影响者
从2019年4月起,金元陆续担任毕马威企业社会责任创新大赛(2-18-2019)媒体志愿者
、宝山区中学生骨干训练营(2019)媒体志愿者
、JOBinn第16季职涯加速营学生教练
,在活动中分享自己的成长与感动,以专业的教练思维引导他人自我探索,用自己的热情与热爱来影响给更多的青年。

社会公益活动
社会公益参与者
作为一名交大学生,金元积极承担社会责任,在社会公益活动中丰富自己的价值。
大学期间,金元曾担任TEDx演讲志愿者
、华为全联接大会志愿者
、毕马威企业社会责任创新大赛志愿者
和宝山区中学生骨干培训志愿者
。依靠学院特色,在担任华为全联接大会志愿者期间,他使用中英法三语为中外嘉宾提供信息引导。
2019年,金元参加了联劝公益组织的“一个鸡蛋的暴走”活动,挑战十二小时内暴走五十千米,与团队为留守儿童募集善款五千余元。

💬社会评价
情况简介
金元研究生期间25门课程评级为A类
,其中7门课程评级为A+
,以下是部分任课教师和小组同学对金元的评价。
李颢教授,《自动化与系统控制》任课教师
王金元同学在2021年秋季学期学习了《自动化与系统控制》一课,他学习态度认真,勤奋刻苦
,对自己有更高的要求,出色完成了本课程的项目考核,获得了A+
的成绩。在项目考核中,金元独立负责
使用课上教授的传统自动控制方法来解决项目问题,经过不懈努力,出色解决了问题。作为项目报告的第一作者
,金元以严谨的学术态度、务实的实验设计、精美的可视化效果
,和小组成员共同完成了一份学术论文标准
的项目报告。
马汝辉教授,《云计算》任课教师
金元在2021年秋季学期学习了《云计算》一课, 出色完成了本课程的三个项目考核,获得了A+的成绩
。金元是一个自驱力非常强
的学生,对自己有更高的要求。本课程的三个项目分别涉及云计算领域的三个不同的细分任务,金元展现出了高超的解决问题能力
,依靠强大的信息搜寻能力
,他能够在短时间内快速学习全新的领域和全新的知识
。在每个课程项目中,金元不仅是在完成本课程的作业,更是在为自己未来涉足云计算领域打下坚实的基础
, 抱着这样的信念,金元以认真求实的态度
和优异的实践能力
,出色完成了精美、详实的课程报告,并将项目成果开源。
吴晨涛教授,《并行数据处理》任课教师
王金元同学在2022年春季学期学习了《并行数据处理》一课, 他学习态度认真,课堂参与度高
。在本课程的四个课程项目中, 金元展现出卓越的代码能力
和对计算机基础知识出色的掌握
, 获得了A+
的成绩。在项目考核中,金元借助MPI底层接口,独立完成并行程序的设计、实现以及不同参数的对比,展现出了高超的独立解决问题的能力
,在他精美、详实的课程报告中也处处透露出他认真的学习态度
和严谨的处事风格
。特此推荐申请研究生优秀奖学金。
Keunwoo Lim教授,《无线物联网》、《物联网设计》任课教师
Noé took the course “Wireless IoT” in 2021 Fall and “IoT Design” in 2022 Spring and was awarded A+
in both courses. Overall, Noé acted as a well-trained engineer in communication and problem-solving
. His meticulous attitude and high-quality performance in study have impressed me most in the class
. During the course, Noé showed high participation
and often raised questions with insights. In the final course projects, Noé showed extraordinary coding ability
and excellent mastery of the course knowledge
, delivering superb independent problem-solving and result-analyzing ability through his exquisite and detailed
course reports.
David Li同学,《数据挖掘》小组成员
Noé completed the Data Mining course (ICE6407P-260-M01) during the Spring semester of 2022. Our team achieved an outstanding grade of A+
in this course. Throughout the class, Noé consistently demonstrated the qualities of a well-trained elite engineer
, particularly in the areas of communication and problem-solving. His meticulous approach and exceptional performance in his studies left a lasting impression on me
.
In the final data challenge project, Noé served as the leader
of our team. Together, we tackled the link prediction problem using cutting-edge deep learning techniques such as graph convolution
, pre-trained language models
, and the bi-encoder framework
in the context of dense passage retrieval tasks. Thanks to Noé’s guidance and expertise, our team secured the 4th position
on the Kaggle leaderboard. Furthermore, Noé generously shared the project code as open-source
to facilitate reproducibility.
Noé’s coding ability proved to be excellent
, and his mastery of deep learning frameworks was extraordinary
. He exhibited remarkable independent problem-solving skills and showed great proficiency in analyzing results, as evidenced by our meticulous and detailed course report. Overall, Noé’s performance throughout the course was truly exceptional.