登录
|
立即注册
首页
DeepSeek专区
AI应用生态
论坛
社区
文档
下载
沐曦大学
沐曦开发者社区
»
论坛
›
社区公共
›
新手社区
›
内容
发新帖
沐曦竞赛平台计时方式
[复制链接]
100
2
发表于 2024-11-20 19:14:39
|
查看全部
|
阅读模式
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
现在在竞赛平台上的计时方式可能不太正确,修改main.cpp函数中需要处理的数据量可以让耗时大大减少,这显然是不公平的。具体来说,我在lab2中把main函数中的nBodies从2 << 11 改成2 << 10,就能让耗时从166.7ms下降到142.15ms。如果我在main.cpp中直接抛出个异常,也能在提交后的允许日志中看到这个异常。
应该只使用kernel.cpp和kernel.h两个文件。
另外我也好奇现在是否会检查答案的正确性。
举报
回复
精彩评论
2
kouryoubon
注册会员
发表于 2024-11-21 14:06:42
|
显示全部楼层
会改成只记录kernel的运行时间
举报
回复
guanhua.hou
注册会员
发表于 2024-11-22 21:16:59
|
显示全部楼层
1. 已经更新,根据 kernel 函数耗时排名。
2. 后面会更新,只使用上传的 kernel.cpp和kernel.h两个文件。
3. 肯定会检查答案正确性。
举报
回复
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
HanzhenLu
注册会员
1
主题
0
回帖
71
积分
Ta的主页
发私信
图文热点
【微调打榜内测】【书生】端侧小模型论
在智算大语言模型蓬勃发展的浪潮中,书生・浦语(InternLM)脱颖而出。书生・浦 ...
LMDeploy部署&&xtune微调IntenLM
XTune微调及验证截图 LMDeploy推理及验证结果(做完的时候没看到后面写的要截图 ...
有没有C500的安装视频?
请问有没有C500的安装视频? 目前买了两张C500的显卡, 但是不知道怎么安装? ...
推荐话题
1.
沐曦MXMACA平台上pytorch构造CUDA算子库扩
2.
驱动安装kernel不匹配,cp: can't stat
3.
曦云 C500 跑 普通版本的 Qwen 可以,但是
4.
驱动装好了 但是使用vllm的benchmark 报错
5.
曦云C500 这个显卡功耗温度是不是有点异常
6.
【微调打榜内测】【书生】端侧小模型论文分
7.
【五一内测】沐曦玩转 LMDeploy、XTuner 和
8.
LMDeploy部署&&xtune微调IntenLM
精彩时刻
【微调打榜内测】【书生】端侧小模型
在智算大语言模型蓬勃发展的浪潮中,书生・浦语(InternLM)脱颖而出。书生・浦语凭
LMDeploy部署&&xtune微调IntenLM
XTune微调及验证截图 LMDeploy推理及验证结果(做完的时候没看到后面写的要截图保存
有没有C500的安装视频?
请问有没有C500的安装视频? 目前买了两张C500的显卡, 但是不知道怎么安装? 没
沐曦玩转 LMDeploy、XTuner 和 Inter
体验了一下模型量化和微调
【大模型实战营】【报名】欢迎论坛小
恭喜小伙伴成功报名第五期书生大模型实战营!所有课程免费!!! 第五期项目申报地
新人必看
社区规则
隐私保护
监督机制
关于版权
技术支持邮箱:support-sw@metax-tech.com
法律声明
联系我们
©沐曦 沪ICP备2020031767号-1
快速回复
返回顶部
返回列表