Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Лёха в Short’ах Long’ует
Лёха в Short’ах Long’ует
David's random thoughts avatar
David's random thoughts
David's random thoughts avatar
David's random thoughts
昨天ARL文章发出去之后有质疑为何用gcc 12 -march=alderlake而非gcc 14 -march=arrowlake进行SPEC测试。

去年我确实考虑升级编译器重做排行,后来用gcc 14测了21个CPU后我得出gcc近年性能完全在摸鱼的结论于是就没怎么继续做了。

既然有人提到,这里给出gcc 14 -march=arrowlake的测试。高了1%。
看起来mesa 24.3.x的vulkan驱动可以用核显的XMX
最近手里的闲置老显卡基本出二手卖完了,不得不把7800XT拆下来准备给ARL亮机,再腾一部分W7900来日常用

于是尝试极限单卡llama 70B,用llama.cpp iq4_xs模型量化+q4_0量化kv+128K上下文,跑了一天刚好贴着线,还剩不到200M显存

推理效果意外的还不错,性能也比之前双卡q8要好的多(单用户~16 token/s)
04.02.202518:48
好日子还在后面呢,特意留了H45平台4核Lion Cove的数据就等着明年测PTL对比。
31.01.202509:21
LLM flash attention kernel恐怖如斯,在家用APU这种砍了寄存器的RDNA3.x GPU上一打开FA prefill性能直接成比例的下降,几乎就是砍多少寄存器就掉多少性能🙃

好在给255H凑对比数据并不需要开flash attention,因为Intel iGPU现在根本没有flash attention实现可用😡
29.01.202503:45
与其相信一个新的大模型恰好在模型发布后的一周、论文发布后的第五天能让芯片板块蒸发一万亿市值,还不如大年初一去医院看看脑子是不是有什么毛病……

https://x.com/TechPowerUp/status/1884145246931480992
21.10.202406:58
极客湾的Lunar Lake评测里的那个Strix Point的能效曲线让我怀疑我在用Zen 6(逃

https://x.com/Lustre_Blade/status/1848243636443689288
04.02.202516:44
TSMC救不了Intel:酷睿Ultra 7 255H(Arrow Lake H45)测试

https://blog.hjc.im/tsmc-cant-save-intel-core-ultra-255h-arrow-lake-h-review.html
30.01.202517:25
也许是唯一真正还有那么一点点值得看一眼的Surface

https://twitter.com/pavandavuluri/status/1884982425526399418
26.01.202514:42
画了一大堆ARL-H的各种能效曲线(单线程/全核/6大核/8小核),越来越感到TSMC救不了Intel😅
30.09.202411:08
所以所谓技术中立并不是说技术人员不能去参与政治话题讨论,而是不要顶着项目或者团队的名义去参与项目无关的政治议题,因为项目本身通常允许不同倾向的人贡献。要么就学习GNU从最开始就用license表述清楚团队的政治目标。

个人账号通过开源项目贡献获得关注和声量并用于积极表达政治观点,则是完全OK
Fedora rawhide的master branch内核可以用主线amdxdna NPU驱动了,可以考虑试着拿onnx跑个什么模型。

(图中为Debian LXC container)
才看到llama.cpp合并了Phi3.5-MoE的支持,这种应该是最适合Mac或者大号APU运行的模型了。Mac Mini实测30+ t/s,等什么时候玩到Strix Halo也跑一下。
21.09.202406:59
某3万亿: 我们不希望OEM能随意hack操作系统,所以要让芯片厂商设计一套安全机制实现绕过固件加载我们的可信binary以达到完全阻止固件篡改OS内存的目的,并强制推广到所有预装PC;

also 某3万亿: OEM预装镜像,wpbt,系统更新推送第三方驱动。任硬件厂商挑选,多种姿势随意往用户的系统里塞高权限代码!
Shown 1 - 16 of 16
Log in to unlock more functionality.