2019年8月

Fedora 30 使用Optimus技术笔记本的独显驱动方法

作者: Esper
时间: 2019-08-29
分类: Linux,驱动程序,操作系统,软件
评论

在国内逛了老半天，都tm是那几篇博客，讲的方法我从f26试到f28，没有一次是成功的（生气）。然后到国外逛，在Reddit上看到了有不少人在对这个进行讨论。有人直接用nvidia的.run文件安装驱动，然后上bumblebee管理，也有人用rpmfusion里的驱动，也有人用Negativo17的nvidia驱动源。为啥我只给最后一个方式添加链接呢？因为这就是本篇的主角。至少在我华硕+HM175的笔记本上，使用原生驱动加bumblebee在配置正确的情况下是会直接让电脑死机的，也不知为啥，看到Negativo17这个名字的时候，总有种熟悉感，而且直觉告诉我用了这个一定会配置好。。。

直接上操作了：

为了让电脑首先正常地启动，修改/etc/sysconfig/grub中的GRUB_CMDLINE_LINUX变量，如果有与modeset相关的一律删掉，改为rd.driver.blacklist=nouveau用以在开机时不加载会让电脑卡死的nouveau驱动。在此顺便提一下：nomodeset将不会加载任何驱动，直接使用llvmpipe以兼容方式实现最基本的图形输出；nouveau.modeset=0将会加载但不使用nouveau驱动，若是cpu有核显的话会加载并使用对应的核显驱动。

添加软件源

sudo dnf config-manager --add-repo=https://negativo17.org/repos/fedora-nvidia.repo

安装驱动基本驱动对应的是nvidia-driver，需要使用CUDA的话还需要安装nvidia-driver-cuda和cuda-devel；需要看X Server Settings的安装nvidia-settings。 GPU开发者全家桶：
```
sudo dnf install nvidia-driver nvidia-driver-cuda cuda-devel nvidia-settings
```
根据作者描述，如果是游戏玩家的话，可能还需要32位的图形库nvidia-driver-libs.i686。

装完就完事了。直接能用。

然后根据作者描述有以下两种情景： 1）使用nvidia的官方闭源驱动：在该场景下能最大程度地发挥GPU的性能，但是所有应用将运行在nvidia GPU上，因而无法关闭； 2）使用nouveau开源驱动：对于GPU的使用可能不是十分充分，但是可以选择是否将应用运行在nvidia GPU上，因而可以从某种程度上节省电能，即在该模式下，允许nvidia GPU休眠。也就是说，使用Negativo17的驱动源，在目前的Fedora上是无法兼顾性能与能耗的。

（有人在Reddit论坛上提到，nvidia官方的run文件不受linux发行版的包管理器管理，会修改许多文件，可能与其他软件造成冲突；自身的卸载指令也无法完全生效，总之就是卸不干净。。。反正据他们推荐，在好还是用包管理器提供的显卡驱动）

Intel软件开发人员手册中的#SS(0), #GP(0)

作者: Esper
时间: 2019-08-25
分类: 编程语言,汇编
评论

最近看到rpcs3中用到了asmjit，就去其官方项目上看了一下，根据描述是个即时生成目标平台汇编代码的库，但是看了一下样例之后发现有些东西还是没法完全理解。其中之一就是ret指令。在样例代码中是这么写的：

  ...
  x86::Assembler a(&code);
  a.mov(x86::eax, 2);
  a.add(x86::eax, -3);
  a.ret();
  ...

然后就想，既然Assembler模拟的是汇编指令，那么ret指令返回EAX的值会不会是某种约定呢？然后打算查阅Intel的汇编指令手册，官方名叫Intel® 64 and IA-32 Architectures Software Developer’s Manual，里面有对指令的详细介绍。看到ret指令对应的伪代码有整整几页，有点慌啊。。其中有这么几句：

IF top 4 bytes of stack not within stack limits
    THEN #SS(0); FI;
EIP ← Pop();

当时就对这个#SS(0);有点迷惑。然后在谷歌上查到了相似的使用方法，但是仍然没看到正式的定义。但是在一个网站上可能看到了类似的定义(http://www.scs.stanford.edu/05au-cs240c/lab/i386/RET.htm，惊了，是斯坦福)：

Protected Mode Exceptions #GP, #NP, or #SS, as described under "Operation" above; #PF(fault-code) for a page fault

然后便开始猜测#<abbr>(<val>)的用法为带返回码的异常抛出：其中PF对应page fault的话，根据搜索，SS对应的为stack smashing，即栈溢出；GP对应general peotection，该机制旨在确保程序访问有效的地址区域；但是NP这个not present就有点搞不懂了。。似乎是指什么不存在？

虽然还是有对不上的。。但是大部分意义都是可以对上的，因而认为猜测正确。

总而言之，这个格式的意义是明白了：Intel使用的伪代码中的异常抛出语句。

LLVM 7.1.0 gnueabihf版本编译记录

作者: Esper
时间: 2019-08-23
分类: 编译,PYNQ-Z2,硬件,软件
评论

LLVM连同组件一起编译

对LLVM有初步了解的话，会发现LLVM可以被描述为编译器的“中后端”。也就是说，LLVM本身不是一个完整的编译器，需要与编译器前端等组件配合使用才能完成完整的编译过程。作为可选组件形式与LLVM一同发布的配件就有配置的讲究了。根据CMakeList文件对组件的配置，加上网上其他人对于编译过程的总结，对组件及其位置罗列如下：

文件名	对应组件	对应位置
llvm-.src.tar.gz	LLVM本体	`./`
cfe-.src.tar.gz	Clang	`./tools/clang`
compiler-rt-.src.tar.gz	Compiler-RT	`./projects/compiler-rt`
libcxx-.src.tar.gz	libcxx	`./projects/libcxx`
libcxxabi-.src.tar.gz	libcxxabi	`./projects/libcxxabi`
libunwind-.src.tar.gz	libunwind	`./projects/libunwind`
lld-.src.tar.gz	LLVM连接器	`./tools/lld`
lldb-.src.tar.gz	LLVM调试器	`./tools/lldb`
openmp-.src.tar.gz	OpenMP支持	`./projects/openmp`
polly-.src.tar.gz	(暂时不懂)	`./tools/polly`
clang-tools-extra-.src.tar.gz	Clang附加工具	`./tools/clang/tools/extra`
test-suite-.src.tar.gz	测试程序(相当大)	`./projects/test-suite`

编译时遇到错误：r7 cannot be used in asm here

https://tls.mbed.org/kb/development/arm-thumb-error-r7-cannot-be-used-in-asm-here

根据上述网站叙述，该问题在于gcc对于arm处理器中寄存器的使用方式与arm自身对编译过程的优化中产生了冲突。arm优化的函数在汇编中显式地使用了编号为r7的寄存器，而在不经优化的情况下，r7被gcc用作帧指针寄存器，不允许被显示地用作其他用途，从而报错。

在解决这个问题时，发现另一个问题：理论情况来说，发布的稳定版的软件源码在编译时会默认设置为发布版本Release，在该模式下，编译器将会对目标软件进行大幅优化以加快运行速度（比如常见的开启-O2或-O3选项），删除不必要的调试信息从而缩小软件大小。而LLVM却将其默认设置为了调试版本Debug，在该模式下，将保留较多的源代码信息，能够在出错时较好地帮助开发人员进行调试，也会相比发布版本有着更加接近原代码的二进制逻辑过程，而这也正是上面在直接编译LLVM时遇到错误的原因。

因而解决方法十分清晰了：将CMake中决定编译版本的参数设置为Release即可。

cd /path/to/llvm/src
mkdir build
cd build
cmake .. -DCMAKE_BUILD_TYPE=Release

然后再加上其他需要的参数配置完以后，使用make进行编译即可。

若是只想解决该问题并编译调试版本的话，在编译器参数中加上-fomit-frame-pointer选项即可。

玄冰300+信越7921使用记录

作者: Esper
时间: 2019-08-21
分类: 硬件
评论

台式机，E3 1245 v2，风扇是玄冰300，之前装电脑的时候不懂事，把涂好了硅脂的新风扇按上cpu后，又拿下来看一下压匀没再装上去。（错误操作请勿模仿：这样会在cpu与风扇接触面之间产生气泡，降低导热效率）用了一年，拆下来之前试了一下，开个rpcs3游戏，（咳咳，~~rpcs3性能测试专用软件——冷门星mk2（大雾）~~），六十五六度的样子。

然后本来打算给用了两年的笔记本换个7921，结果。。拆的时候散热螺丝拆坏了，花钱修好顺便上了原装硅脂。然后就想起了如上所述的神奇操作，感觉还是换一下比较好。然后两个重点：

玄冰300的正确拆卸方式玄冰300的固定原理是用卡扣将风扇固定在（固定在主板上的）底座上。将风扇上与卡扣相连的金属环向下压，将卡扣较为自然地移出即可。
7921的正确涂法网传众多涂法，包括一字、十字、五点、九点，甚至涂匀。台式机上可以直接涂一字，与散热铜管方向垂直即可。（经少量硅脂测试，在涂成圆点的情况下会按照铜管方向扩散得更远）从左涂到右，两边可以留个2-3mm左右的间距，然后直接平压安装风扇即可。这个时候要保证cpu和风扇紧贴，不然进气泡就没什么意义了= =涂完之后从四周侧边观察，有极少量的硅脂溢出，猜测恰好覆盖完全。笔记本的话可以考虑用刮板在核心上涂好再装散热。但是根据网友反映，这橡皮泥黏刮板比黏核心严重多了。。因而有网友提出，可以按照散热上的金属标记槽（往往是方形）涂好硅脂，然后再与核心贴合。

然后再开冷门星mk2，温度都上不了60度了，快乐

VS2019+CUDA9.2

作者: Esper
时间: 2019-08-11
分类: 编译,Windows,操作系统,软件
评论

https://devtalk.nvidia.com/default/topic/1049681/nsight-visual-studio-edition/nvidia-nsight-visual-studio-edition-2019-1-with-cuda-9-2/

把C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2\extras\visual_studio_integration\MSBuildExtensions下的文件复制到C:\Program Files (x86)\Microsoft Visual Studio\2019\Professional\MSBuild\Microsoft\VC\v160\BuildCustomizations中
编辑C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2\include\crt\host_config.h的133-135行，强行添加对新版本VC++的支持。把133行的1913改成1921，要是不怕出事可以直接注释掉整个if。我的个人修改方法：在修改133行的同时，139行插入

#elif _MSC_VER == 1921

#pragma message("support for Microsoft Visual Studio 2019 is unofficial!")

用于验证修改是否有效。

有一点要注意的是，CUDA若是安装在默认的X:\Program Files目录下的话，修改其中的文件通常需要管理员权限。而我使用的gedit会很神奇地在没有权限的时候（即以普通用户权限保存文件），不知道自动在哪创建一个同名副本保存，并且还会每次贴心地读取副本。。。我一直以为是哪里缓存的问题，直到重启电脑发现文件变回原样才想起来。。。所以说在权限问题上尽量要清晰，不要偷懒或者马虎。