跳到主要内容

每周一龙:第 21 期

· 阅读需 4 分钟
WANG Xuerui
🐲龙门客栈打杂的

每周一都为大家报道 LoongArch 社区最前线的第一手新鲜资讯!

如无特别说明,文中提及的日期、时间都为北京时间(UTC+8)。

先「马」再看

本栏目的内容具有一定延续性,将持续追踪报道 LoongArch 领域的重要或长期项目(坑)。

Linux

10 月 19 日,Huacai Chen 发出了 v6.6 开发周期的第三组 LoongArch 架构相关修复, Linus 很快将其拉入了主线。 这些内容已在美西时间周日下午的 v6.6-rc7 tag 发布了。 内容有:

  • 周报第 19 期报道的 Icenowy Zheng 的 LoongArch 写合并问题规避方式修复, 实测解决了 AMD GPU 系统的许多纹理损坏问题。
  • 同样在第 19 期报道的上游开发者 Deepak 发现的实时内核相关重构需求, 由 Huacai Chen 实现
  • Tiezhu Yang 重构的一些汇编代码中对符号性质的标注。
  • Huacai Chen 实现的第 18 期周报中发现的构建错误修复。

工具链

gcc

10 月 19 日,Xi Ruoyao 完成了国庆以来一直在做的指令调度与 linker relaxation 的平衡取舍工作,向邮件列表发出了第一稿。 (对于先前发现的 binutils BFD 链接器 不会 relax 任何共享库的问题,mengqinggang 写了一版修复。)

LLVM

10 月 17 日,yjijd 提交了 和 leecheechen 合作开发的,为 Clang 添加 LSX/LASX builtins 支持的补丁。 有这部分支持之后 Clang 就可以编译向量优化的 C 代码,而不用依赖手写汇编了。

同一天,wangleiat 教会了 LLVM 在 LoongArch 浮点条件码寄存器间搬运数据。 在此之后,寄存器分配工序就可以放开手脚随意使用这部分寄存器了。 (值得一提的是,在代码审查过程中,偶然发现此变更清零 FCC 的方式比 GCC 先前使用的方式要快许多。 当天 Xi Ruoyao 便将此优化移植到了 GCC, 第二天即合并了。)

杂闻播报

近日,龙芯开发者 zhaojunchao 向微软公司维护的跨平台、高性能机器学习推理、训练加速方案 ONNX 运行时提交了 LoongArch 向量优化。 (感谢 mengqinggang 投递新闻线索!)

前一段时间,Debian 邮件列表管理员完成了 Debian LoongArch port 邮件列表的创建操作。 后续可以在这里订阅、看邮件归档了。 (感谢 SnowNF 投递新闻线索!)

张贴栏

本栏目可供张贴公益性质的各种信息。

  • 友情扩散:安同开源社区(AOSC)的龙架构移植主线化工作「合龙」仍在如火如荼进行中, 此工作完成后龙架构将升格为 AOSC OS 的 Tier 1 架构。 欢迎同学们试用、反馈,也欢迎有志之士一同加入(沟通渠道详见 AOSC 网站相关栏目)。
  • 本周报持续接受网友投稿。欢迎来上游坐坐!