Win32 API编程——前言
一丶什么是Win32 API?
微软为了保护操作系统的安全性和稳定性,把系统分为内核层和用户层(内核层的代码只能在当CPU的特权级为R0状态下执行,用户层的代码在CPU特权级为R0和R3都能执行),windows在内核层构建了一套管理和保护机制,用于维护系统的正常运行,这些机制的实现被称为系统内核。为了区别于windows的内部实现,把我们日常使用的应用程序所运行的环境称为用户层,此时CPU特权级为R3,无法调用系统的内核函数。但是,只有内核函数才能操控硬件,所以windows又提供了可在用户层调用的函数接口,即Windows API,调用API最后调用的是系统的内核函数。
所有基于NT内核(XP到Win10都是基于NT内核开发)的Windows API都可以称为Win32,即便是64位系统,也用这个名称,因为64位系统是完全兼容32位程序的(纯32位系统不兼容16位程序),所以你可以看到这些DLL名称都有个"32"的后缀。那我们用C/C++写程序,没用到Win32,怎么也能够执行分配内存,打开进程等操作呢?实际上在Windows系统上的C/C++的运行库内部也是封装了Win32API。进一步说,几乎所有运行在Windows用户层的程序都调用了Win 32API。
Windows采用分层结构,大致来说就是(用户层->内核层->硬件抽象层->硬件层)(这里的分层只是指一个功能分成多个层次执行,Windows下CPU只有内核模式R0和用户模式R3两种状态),
一个Win32 API调用的大体过程如下:
Win32 API(kernel32.dll、user32.dll等函数)->调用ntdll.dll函数->使CPU进入内核模式(改变CPU特权级为R0)->查表并调用ntoskrnl.exe或win32k.sys内的函数(ntoskrnl.exe即nt系统内核程序,提供内存、进程管理等服务,同时内部包含了windows的内核函数。在任务管理器中的名字为System)->执行结束返回到用户模式(改模CPU特权级为R3)
Win 32API大多是微软提供的给ntdll.dll函数的封装,而ntdll.dll是执行内核函数的中介层,由其内的函数进入内核(改变CPU特权级)并调用内核函数。你可以直接调用ntdll.dll的函数,甚至自己编写访问内核函数的接口(有些调用被windows保护程序禁止),这样程序的运行效率会更高,但是我们还是从那几个常用的dll开始学习更为简单。要知道的是,虽然通过Win32 API调用了内核函数,实现了用户层与内核层的交互,但其实大多内核函数都是未公开的。
二丶为什么要学Win32 API?
现在用于windows平台的程序开发方式日新月异,种类繁多,比如使用Delphi、WPF、Qt等,开发效率远高于使用Win32 API开发,那为什么还要学习使用Win32 API开发呢?
①理解Windows程序底层运行机制。
②帮助学习Windows上其他的编程语言、平台。
③实现其他库没有提供的高级功能,比如修改其他进程内存等。
三丶如何学习?
学习Win32,其实只是在学习两样东西:机制、函数
机制是Winows运作的规则,函数是实现功能的手段
Windows已经推出了成千上万个API函数,要想一一搞懂是不可能的,也是完全没有必要的。学习的目的在于实践,不用于实践的学习没有价值,也很容易遗忘。
本文简单介绍最常用函数及相关机制,需要深入了解请自行查阅MSDN文档及相关文献。
四丶开始前你必须知道
语言基础: C/C++
开发平台: Visual Studio
编码格式:Unicode
----------------------
为什么区分编码格式?
windows程序的编码格式分为两种:ANSI(MBCS:多字节字符集)和Unicode,Windows会按程序的编码格式解码字符。
ANSI:根据系统当前设置的语言采用不同编码,比如系统语言设置为简体中文,则ANSI采用GBK编码。
Unicode:统一的字符集,在所有系统中均相同,每个字符占用两个字节。
为什么使用Unicode?
①Windows NT是使用Unicode开发的,调用API时要把ANSI字符转换成Unicode字符,直接使用Unicode可以提高运行效率。
②使你的程序在不同语言的系统上运行时不会出现乱码。
③一些API只能处理Unicode字符。
怎么设置Unicode?
修改编译器设置
项目->属性->高级->字符集:使用Unicode字符集
设置后观察
项目->属性->C/C++->命令行:看到两个选项 /D "_UNICODE" /D "UNICODE",说明已成功设置为Unicode编码,否则看到选项 /D "_MBCS",说明使用的是MBCS编码。
其中_UNICODE定义在C运行库的头文件中,UNICODE定义在Windows的头文件中。
----------------------
尽量使用Windows数据类型
在平时使用C/C++编程时,我们都使用C/C++标准提供的数据类型,比如:char,shot,int,long int等等,但是在使用Windows API编程时,我们应该尽量使用Windows提供的数据类型,因为Win32 API函数都是使用Windows数据类型编写的,所以你必须要认识它。事实上,这些Windows数据类型都是在windows头文件中对C/C++库原生类型的宏定义,本质上并无差别。下面列举常见的Windows数据类型。
类型前缀:
c=const 常量
u=unsigned 无符号
p=pointer 指针
h=handle 句柄
w=word 字
dw=double word 双字
sz=strinszg terminated with a zero 以0结尾的字符串
lp=long pointer 长指针
函数后缀:
A=ansi字符 参数接受ANSI字符
W=wide宽字符 参数接受Unicode字符
Ex=extended 扩展版函数,在原函数基础上增加某些新的特性
Windows类型举例:
typedef int INT; typedef int BOOL; typedef unsigned int UINT; typedef unsigned short WORD; typedef WORD near *PWORD; typedef WORD far *LPWORD;
其他定义详见 <minwindef.h>
near指针NP,far指针FP,long指针LP,是为了兼容16位程序,在32位编程中都为P(32位指针)
------------------------
在字符串前添加 L标志:该字符串将按宽字符(Unicode)编码
TEXT、__TEXT(winnt.h内定义的宏)
如果 UNICODE被定义,则在字符串前添加L
_T、__T、_TEXT(tchar.h内定义的宏)
如果 _UNICODE被定义,则在字符串前添加L
#ifdef UNICODE #define __TEXT(x) L##x#else #define __TEXT(x) x#endif
------------------------
带T前缀的数据类型,根据是否定义UNICODE使用宽/窄字符
#ifdef UNICODE typedef wchar_t TCHAR;#else typedef char TCHAR;#endif
五丶其他
笔者学习中,尽量在保持准确性、严谨性的同时使用比较自然的语言来写。
水平有限,不足之处欢迎批评指正。
本文由Celng原创,转载请标明出处。