关于显示加载动态链接库模块及卸载的问题
问题起因是,在一次模块卸载后,程序运行异常。遂对动态链接库做一些测试。
动态库加载方式有两种,隐式加载和显示加载,隐式加载包含xxx.lib导入库,在程序执行之前由动态加载器完成所有加载;显示加载则使用LoadLibrary方式;具体数据可参考《程序员的自我修养:链接,装载与库》一书。
动态库头文件:
1 #ifdef DYNAMICLIBRARYTEST_EXPORTS 2 #define DYNAMICLIBRARYTEST_API __declspec(dllexport) 3 #else 4 #define DYNAMICLIBRARYTEST_API __declspec(dllimport) 5 #endif 6 7 // 此类是从 dll 导出的 8 class DYNAMICLIBRARYTEST_API Base { 9 public: 10 Base(void); 11 12 virtual int* virtualFunc(); 13 virtual ~Base(); 14 15 16 int a = 8; 17 int b = 9; 18 char c[10] = {'H','e', 'l', 'l', 'o', 'W', 'o', 'r', 'l', 'd' }; 19 // TODO: 在此处添加方法。 20 }; 21 22 class DYNAMICLIBRARYTEST_API Derive : public Base 23 { 24 public: 25 Derive(void); 26 int* normalFunc() 27 { 28 return nullptr; 29 } 30 31 int* virtualFunc() override; 32 ~Derive(); 33 // TODO: 在此处添加方法。 34 }; 35 36 extern "C" DYNAMICLIBRARYTEST_API int i_global; 37 38 extern "C" DYNAMICLIBRARYTEST_API double d_global; 39 40 extern "C" DYNAMICLIBRARYTEST_API char c_global[6]; 41 42 extern "C" DYNAMICLIBRARYTEST_API int func1(void); 43 extern "C" DYNAMICLIBRARYTEST_API Derive* createDerive();
View Code
动态库实现文件:
1 // DynamicLibraryTest.cpp : 定义 DLL 的导出函数。 2 // 3 4 #include "DynamicLibraryTest.h" 5 // 这是导出变量的一个示例 6 DYNAMICLIBRARYTEST_API int i_global = 1; 7 int i_global_1 = 9; 8 DYNAMICLIBRARYTEST_API double d_global = 2 ; 9 DYNAMICLIBRARYTEST_API char c_global[6] = {'G', 'l','o', 'b', 'a', 'l'}; 10 11 // 这是导出函数的一个示例。 12 DYNAMICLIBRARYTEST_API int func1(void) 13 { 14 return -1; 15 } 16 17 Derive * createDerive() 18 { 19 return new Derive; 20 } 21 22 Base::Base() 23 { 24 return; 25 } 26 27 28 int* Base::virtualFunc() 29 { 30 return nullptr; 31 } 32 33 Base::~Base() 34 { 35 } 36 37 Derive::Derive(void) 38 { 39 } 40 41 int* Derive::virtualFunc() 42 { 43 int c = a + b; 44 c--; 45 return new int[10]; 46 } 47 48 Derive::~Derive() 49 { 50 }
View Code
查看导出符号:
可以看到导出的变量命名比较正常,这是因为是以C风格导出的。不然就是C++的诡异风格修饰。
主程序实现:project.cpp
1 // project.cpp : 此文件包含 "main" 函数。程序执行将在此处开始并结束。 2 // 3 4 #include <iostream> 5 #include "DynamicLibraryTest.h" 6 #include <Windows.h> 7 8 #define LIBNAME "C:/Users/Admin/source/repos/DynamicLibraryTest/Release/DLL_1.dll" 9 10 typedef int*(*NormalFunc)(); 11 typedef Derive*(*CreateDerive)(); 12 int main() 13 { 14 const char* szStr = LIBNAME; 15 WCHAR wszClassName[256]; 16 memset(wszClassName, 0, sizeof(wszClassName)); 17 MultiByteToWideChar(CP_ACP, 0, szStr, strlen(szStr) + 1, wszClassName, sizeof(wszClassName) / sizeof(wszClassName[0])); 18 HMODULE hmodule = ::LoadLibrary(wszClassName); 19 if (NULL == hmodule) 20 { 21 printf("LoadLibrary failed/n"); 22 return -1; 23 } 24 25 CreateDerive funcDerive = (CreateDerive)GetProcAddress(hmodule, "createDerive"); 26 NormalFunc nor = (NormalFunc)GetProcAddress(hmodule, "?normalFunc@Derive@@QAEPAHXZ"); 27 Derive* d = funcDerive();//分配在堆上 28 Derive* d2 = funcDerive(); 29 //d->normalFunc();//不能直接调用非虚函数 30 //本模块保存了一份虚表地址在堆上,每次访问虚函数,通过堆上的保存的虚表地址查找真正的虚表, 31 //而虚表保存在映射区域(dll模块的全局常量区,不过映射的数据区域为备份),随着模块的卸载,该映射区域也会消失,导致访问异常。 32 //至于为什么显示加载dll的方式不能调用非虚函数,是因为调用这种函数不需要查虚表,直接调函数地址,但该函数导出名字经过修饰, 33 //会造成无法解析的引用; 子类和父类都有一套虚表,存的是各自的函数地址。 34 int* vb = d->virtualFunc();//ecx寄存器保存的是this指针,即d; 35 d2->a = 2; 36 _asm 37 { 38 mov ecx, dword ptr[d2]; 39 } 40 nor();//此时调用的是d2的成员函数。 41 delete d; 42 int *local = new int[10]; 43 vb[0] = 1; 44 local[0] = 2; 45 int c = vb[0] + local[0]; 46 47 ::FreeLibrary(hmodule); 48 //int* va = d->virtualFunc();//报错 49 return 0; 50 }
显示加载后,得到类对象d,是不能直接通过该对象调用其非虚成员函数的(链接不通过),但是能直接调用虚函数。问题是因为调用虚函数是要查虚表的。下图是project.obj的main部分反汇编代码:
可以看到对于一般的函数调用会生成函数符号,相当于一个占位标记,该符号地址在链接前,用默认地址00 00 00 00 代替(32位机器下),在执行链接后,该默认地址会修改为正确的位置。
链接后的main部分反编译代码:
回到之前的那个问题,为什么一般的成员函数不能直接调用,因为找不到符号(无法解析的引用符号),会导致链接不过。
第一,导出该符号(整个类都是导出的话,该成员函数自然也是导出的)。第二,该符号的名字要写对;
NormalFunc nor = (NormalFunc)GetProcAddress(hmodule, "?normalFunc@Derive@@QAEPAHXZ");
强行获取该方法。那么又有一个问题,这个函数该怎么调用?对于任意一个成员函数来讲,调用会存在一个this指针。直接调用会出现奇怪的现象。其实通常调用成员函数,从汇编的角度,会将this指针赋值给ecx寄存器。接着调用该函数。
上图可以看到ecx与this的关系。通过证实nor()执行的确实是d2的成员函数。
接着下一个问题,卸载模块后,在该模块申请的堆内存数据还在不在?以及能不能继续调用该模块的成员函数。
下图先给出该进程的内存布局(x64Dbg反编译工具):
执行完LoadLibrary后的内存布局:
可以看到dll_1映射到了某个内存地址。
查看dll中normalFunc的函数地址:
对应于dll的代码段映射区域。
查看d和d2的内存区域:
可以看到这两个变量所对应的首4字节值是一样的,这就是虚表地址。
转到虚表地址:
发现该虚表存储在DLL_1的内存区域“.rdata ”段(从前面的内存布局看出)。
那么当真个DLL被卸载时发生了什么?执行完Freelibrary后:
那么显而易见,卸载dll模块后,变量d2是不能调用任何函数的,因为此时地址都清空了,包括虚函数,虚表不存在。而d2这个变量所对应的内存空间依然存在。但是意味着该类对象没法调用析构函数,造成内存泄漏。
其实,在dll申请的内存,最好在该dll里释放,不然会出现奇怪的现象。
。。。待续