导语:fortinet的分析人员发现了Microsoft Windows内核崩溃漏洞 CVE-2018-1040,并分享了对这个漏洞的详细分析。
2018年1月底,FortiGuard Labs team在Microsoft Windows中发现了一个远程内核崩溃漏洞,并遵循Fortinet公司的披露流程向微软报告。6月12日,微软发布了一个咨询通告,其中包含针对此漏洞的修复程序,并将其标识为CVE-2018-1040。
此内核崩溃漏洞位于Microsoft Windows代码完整性内核模块“ci.dll”中。所有主流的Windows版本都受到影响,包括Windows 10,Windows 7,Windows 8.1,Windows Server 2008,Windows Server 2012和Windows Server 2016。
我发现的这个漏洞可以通过从网站或SMB共享上远程下载构造的.dll或.lib文件来触发。使用IE或Edge下载文件并保存时,会导致Windows内核指针间接引用无效地址。因此,引发Windows错误检查(内核崩溃)。在Windows 10上,系统重新启动后,用户登录时会发生内核崩溃。这会导致Windows 10内核一直陷入循环的崩溃之中。
在本博客中,我想分享一下我对这个漏洞的详细分析。
分析
要重现此远程内核崩溃漏洞,可以在Windows 10上打开IE或Edge,输入url http://192.168.0.111/poc.dll(它可以是任何托管PoC文件的URL),然后在弹出窗口中选择“保存“。当保存文件poc.dll时,可以看到Windows 10错误检查(内核崩溃)。对于Windows 10中的内核崩溃,即使重新启动也会继续发生,这会导致Windows 10无法正常工作。对于用户,可能需要重新安装系统。
下面是发生崩溃时的堆栈调用。
图1.发生崩溃时的堆栈调用
从上面的调用堆栈输出中,我们可以看到在调用函数“KERNELBASE!GetFileVersionInfoSizeExW”时会发生内核崩溃,之后它会调用函数“KERNELBASE!LoadLibraryExW”。最后,它会导致整个内核崩溃。
当IE / Edge下载.dll或.lib文件并保存在磁盘上时,它将调用函数“KERNELBASE!GetFileVersionInfoSizeExW”来检索.dll / .lib版本信息。要获取.dll / .lib版本信息,它会调用函数“KERNELBASE!LoadLibraryExW”以加载dwFlags等于0x22的.dll / .lib文件。在Microsoft MSDN中搜索,我们可以看到dwFlags 0x22是“LOAD_LIBRARY_AS_DATAFILE(0x00000002)”和“LOAD_LIBRARY_AS_IMAGE_RESOURCE(0x00000020)”的组合。因此,IE / Edge会将下载的.dll / .lib文件加载为资源.dll / .lib和数据文件来获取相关信息。构造的poc.dll会引发Windows 10发生内核崩溃,即使重新启动也无法恢复系统。这是因为用户登录Windows时,会扫描IE / Edge临时目录中的.dll / .lib文件。
函数LoadLibraryExW加载构造的PoC文件poc.dll。当它处理SizeOfHeaders时,它会得到一个0x06的值(正确的size 是0x200)。在计算CI.dll中的函数CI!CipImageGetImageHash中的sha1散列块size时,会导致整数溢出。溢出的块size是0xfffffeb6。计算后获取的溢出块size为0xfffffe7a,由于构造的sha1块size过大,调用函数CI!SymCryptSha1AppendBlocks会导致大循环和内核内存读取访问冲突。因此,会发生Windows错误检查(内核崩溃)。
图2.包含精心制作的SizeOfHeaders的poc.dll
通过逆向和跟踪,可以看到函数_CipImageGetImageHash的调用导致sha1块size整数溢出。
PAGE:85D15618 [email protected] proc near ; CODE XREF: ...... PAGE:85D1571F mov edx, edi PAGE:85D15721 mov ecx, [ebp+arg_4] PAGE:85D15724 call [email protected] ; HashpHashBytes(x,x,x) PAGE:85D15729 lea edx, [esi+0A0h] PAGE:85D1572F PAGE:85D1572F loc_85D1572F: ; CODE XREF: CipImageGetImageHash(x,x,x,x,x,x,x,x,x)+CF↑j PAGE:85D1572F mov edi, [ebp+arg_10] PAGE:85D15732 mov eax, [edi+54h] ; -----> here [edi+54h] is obtained from poc.dll at offset 0x104, its value is 0x06. PAGE:85D15735 sub eax, edx ; -----> here edx=83560150 PAGE:85D15737 add eax, [ebp+BaseAddress] ----> here [ebp+BaseAddress]=83560000 PAGE:85D1573A push eax ; ---------> So, after the above calculation, eax occurs integer subtraction overflow, result in eax=fffffeb6 PAGE:85D1573B mov ecx, [ebp+arg_4] PAGE:85D1573E call [email protected] ------> the function call chain finally results in a kernel crash PAGE:85D15743 mov esi, [edi+54h] ; PAGE:85D15746 mov [ebp+var_30], esi In following function, an insufficient bounds check is performed: .text:85D0368C @[email protected] proc near .text:85D0368C ; CODE XREF: SymCryptSha1Append(x,x,x)+10↑p .text:85D0368C ; SymCryptMd5Append(x,x,x)+10↑p .text:85D0368C .text:85D0368C var_18 = dword ptr -18h .text:85D0368C var_14 = dword ptr -14h .text:85D0368C var_10 = dword ptr -10h .text:85D0368C var_C = dword ptr -0Ch .text:85D0368C var_8 = dword ptr -8 .text:85D0368C var_4 = dword ptr -4 .text:85D0368C Src = dword ptr 8 .text:85D0368C MaxCount = dword ptr 0Ch .text:85D0368C .text:85D0368C mov edi, edi .text:85D0368E push ebp .text:85D0368F mov ebp, esp . ...... 85D0372D mov ecx, [ebp+var_8] .text:85D03730 mov edx, [ebp+var_18] .text:85D03733 jmp short loc_85D0373B .text:85D03735 ; --------------------------------------------------------------------------- .text:85D03735 .text:85D03735 loc_85D03735: ; CODE XREF: SymCryptHashAppendInternal(x,x,x,x)+46↑j .text:85D03735 ; SymCryptHashAppendInternal(x,x,x,x)+52↑j .text:85D03735 mov ecx, [ebp+Src] .text:85D03738 mov [ebp+var_8], ecx .text:85D0373B .text:85D0373B loc_85D0373B: ; CODE XREF: SymCryptHashAppendInternal(x,x,x,x)+A7↑j .text:85D0373B cmp esi, [edx+18h] ; ----> here [edx+18h] equals 40h, esi equals fffffe7a, due to unsigned integer comparison, the crafted block size is not found .text:85D0373E jb short loc_85D03769 .text:85D03740 mov edi, [edx+1Ch] .text:85D03743 lea eax, [ebp+var_C] .text:85D03746 push eax .text:85D03747 push esi .text:85D03748 mov esi, [edx+0Ch] .text:85D0374B add edi, ebx .text:85D0374D mov ecx, esi .text:85D0374F call ds:___guard_check_icall_fptr ; _guard_check_icall_nop(x) .text:85D03755 mov edx, [ebp+var_8] .text:85D03758 mov ecx, edi .text:85D0375A call esi
随着sha1块size的增加,它最终调用以下函数:
.text:85D01060 @[email protected] proc near ; CODE XREF: SymCryptSha1Result(x,x)+40↑p ...... .text:85D010A4 mov eax, [ebp+arg_0] -----> here eax gets the overflowed sha1 block size= 0xfffffe7a .text:85D010A7 mov [esp+0D0h+var_B4], edi .text:85D010AB mov [esp+0D0h+var_C4], ecx .text:85D010AF cmp eax, 40h .text:85D010B2 jb loc_85D02507 .text:85D010B8 mov [esp+0D0h+var_58], ecx .text:85D010BC mov ecx, [esp+0D0h+var_C0] .text:85D010C0 mov [esp+0D0h+var_54], ecx .text:85D010C4 lea ecx, [edx+8] ; .text:85D010C7 shr eax, 6 -------> the overflowed block size is used as the following loop function counter .text:85D010CA mov [esp+0D0h+var_60], esi .text:85D010CE mov [esp+0D0h+var_5C], edi .text:85D010D2 mov [esp+0D0h+var_68], ecx ; .text:85D010D6 mov [esp+0D0h+var_50], eax -----> here is the loop counter ...... .text:85D01359 ror edx, 2 .text:85D0135C mov ecx, [ecx+28h] .text:85D0135F bswap ecx .text:85D01361 mov [esp+0D0h+var_6C], ecx .text:85D01365 mov ecx, eax .text:85D01367 rol ecx, 5 .text:85D0136A mov eax, edi .text:85D0136C add ecx, [esp+0D0h+var_6C] .text:85D01370 xor eax, edx .text:85D01372 and eax, [esp+0D0h+var_C0] .text:85D01376 xor eax, edi .text:85D01378 add edi, 5A827999h .text:85D0137E add eax, ecx .text:85D01380 mov ecx, [esp+0D0h+var_68] .text:85D01384 add eax, esi .text:85D01386 mov esi, [esp+0D0h+var_C0] .text:85D0138A mov [esp+0D0h+var_84], eax .text:85D0138E ror esi, 2 .text:85D01391 mov ecx, [ecx+2Ch] ----> after a large loop call, here it results in a read access violation, so the bugcheck (kernel crash) occurs .text:85D01394 bswap ecx .text:85D01396 mov [esp+0D0h+var_9C], ecx ....... .text:85D024DD mov ecx, [esp+0D0h+var_68] .text:85D024E1 mov [esp+0D0h+var_54], eax .text:85D024E5 add ecx, 40h ----> memory access pointer increases 0x40 in each loop .text:85D024E8 mov [esp+0D0h+var_C0], eax .text:85D024EC mov eax, [ebp+arg_0] .text:85D024EF sub eax, 40h .text:85D024F2 mov [esp+0D0h+var_68], ecx .text:85D024F6 sub [esp+0D0h+var_50], 1 ------> here the loop counter decreases by 1, not equaling 0, to continue the loop. Due to the overflowed large sha1 block size, here a large loop is executed. .text:85D024FE mov [ebp+arg_0], eax .text:85D02501 jnz loc_85D010DD .text:85D02507
从上面的分析中,可以看到,远程内核崩溃的根本原因是LoadLibraryEx函数无法正确解析作为资源和数据文件构造的.dll / .lib文件。poc.dll包含构造的SizeOfHeaders值为0x06(正确的值应为0x200),该值位于PoC文件中的偏移量0x104处时,发生整数溢出。
构造的size值会导致计算出错误的sha1块size(它会成为负值)。由于边界检查不足,sha1计算函数进入一个较大的循环,这会导致内存读取访问冲突。最后,发生系统错误检查(内核崩溃)。
解决方案
鼓励所有存在漏洞的Microsoft Windows用户升级到最新的Windows版本或应用最新的补丁程序。