C语言高效编程的几招

erxun · 发表于 2007-1-15 11:11:10

C语言高效编程的几招

华中科技大学丁学

编写高效简洁的C语言代码，是许多软件工程师追求的目标。本文就工作中的一些体会和经

验做相关的阐述，不对的地方请各位指教。

第1招：以空间换时间

计算机程序中最大的矛盾是空间和时间的矛盾，那么，从这个角度出发逆向思维来考虑程

序的效率问题，我们就有了解决问题的第1招--以空间换时间。

例如：字符串的赋值。

方法A，通常的办法：

#define LEN 32

char string1 [LEN];

memset (string1,0,LEN);

strcpy (string1,"This is an example!!"

方法B:

const char string2[LEN]="This is an example!"

char*cp;

cp=string2;

(使用的时候可以直接用指针来操作。)

从上面的例子可以看出，A和B的效率是不能比的。在同样的存储空间下，B直接使用指针就

可以操作了，而A需要调用两个字符函数才能完成。B的缺点在于灵活性没有A好。在需要频

繁更改一个字符串内容的时候，A具有更好的灵活性；如果采用方法B，则需要预存许多字

符串，虽然占用了大量的内存，但是获得了程序执行的高效率。

如果系统的实时性要求很高，内存还有一些，那我推荐你使用该招数。

该招数的边招--使用宏函数而不是函数。举例如下：

方法C:

#define bwMCDR2_ADDRESS 4

#define bsMCDR2_ADDRESS 17

int BIT_MASK (int_bf)

{

return ((IU<<(bw##_bf))-1)<<(bs##_bf);

}

void SET_BITS(int_dst,int_bf,int_val)

{

_dst=((_dst) & ~ (BIT_MASK(_bf)))I\ (((_val)<<<(bs##_bf))&(BIT_MASK(_bf)))

}

SET_BITS(MCDR2,MCDR2_ADDRESS,RegisterNumber);

方法D:

#define bwMCDR2_ADDRESS 4

#define bsMCDR2_ADDRESS 17

#define bmMCDR2_ADDRESS BIT_MASK (MCDR2_ADDRESS)

#define BIT_MASK(_bf)(((1U<<(bw##_bf))-1)<< (bs##_bf)

#define SET_BITS(_dst,_bf,_val)\ ((_dst)=((_dst)&~(BIT_MASK(_bf)))I (((_val)<<

(bs##_bf))&(BIT_MASK(_bf))))

SET_BITS(MCDR2,MCDR2_ADDRESS,RegisterNumber);

函数和宏函数的区别就在于，宏函数占用了大量的空间，而函数占用了时间。大家要知道

的是，函数调用是要使用系统的栈来保存数据的，如果编译器里有栈检查选项，一般在函

数的头会嵌入一些汇编语句对当前栈进行检查；同时，CPU也要在函数调用时保存和恢复当

前的现场，进行压栈和弹栈操作，所以，函数调用需要一些CPU时间。而宏函数不存在这个

问题。宏函数仅仅作为预先写好的代码嵌入到当前程序，不会产生函数调用，所以仅仅是

占用了空间，在频繁调用同一个宏函数的时候，该现象尤其突出。

D方法是我看到的最好的置位操作函数，是ARM公司源码的一部分，在短短的三行内实现了

很多功能，几乎涵盖了所有的位操作功能。C方法是其变体，其中滋味还需大家仔细体会。

第2招：数学方法解决问题

现在我们演绎高效C语言编写的第二招--采用数学方法来解决问题。

数学是计算机之母，没有数学的依据和基础，就没有计算机的发展，所以在编写程序的时

候，采用一些数学方法会对程序的执行效率有数量级的提高。

举例如下，求1~100的和。

方法E

int I,j;

for (I=1; I<=100; I++){

j+=I;

}

方法F

int I;

I=(100*(1+100))/2

这个例子是我印象最深的一个数学用例，是我的饿计算机启蒙老师考我的。当时我只有小

学三年级，可惜我当时不知道用公式Nx(N+1)/2来解决这个问题。方法E循环了100次才解决

问题，也就是说最少用了100个赋值、100个判断、200个加法(I和j)；而方法F仅仅用了1个

加法、1个乘法、1次除法。效果自然不言而喻。所以，现在我在编程序的时候，更多的是

动脑筋找规律，最大限度地发挥数学的威力来提高程序运行的效率。

第3招：使用位操作

实现高效的C语言编写的第三招--使用位操作，减少除法和取模的运算。

在计算机程序中，数据的位是可以操作的最小数据单位，理论上可以用“位运算”来完成

所有的运算和操作。一般的位操作是用来控制硬件的，或者做数据变换使用，但是，灵活

的位操作可以有效地提高程序运行的效率。举例台如下：

方法G

int I,J;

I=257/8;

J=456%32;

方法H

int I,J;

I=257>>3;

J=456-(456>>4<<4);

在字面上好象H比G麻烦了好多，但是，仔细查看产生的汇编代码就会明白，方法 G调用了

基本的取模函数和除法函数，既有函数调用，还有很多汇编代码和寄存器参与运算；而方

法H则仅仅是几句相关的汇编，代码更简洁、效率更高。当然，由于编译器的不同，可能效

率的差距不大，但是，以我目前遇到的MS C,ARM C来看，效率的差距还是不小。相关汇编

代码就不在这里列举了。

运用这招需要注意的是，因为CPU的不同而产生的问题。比如说，在PC上用这招编写的程

序，并在PC上调试通过，在移植到一个16位机平台上的时候，可能会产生代码隐患。所以

只有在一定技术进阶的基础下才可以使用这招。

第4招：汇编嵌入

高效C语言编程的必杀技，第四招--嵌入汇编。

“在熟悉汇编语言的人眼里，C语言编写的程序都是垃圾”。这种说法虽然偏激了一些，但

是却有它的道理。汇编语言是效率最高的计算机语言，但是，不可能靠着它来写一个操作

系统吧？所以，为了获得程序的高效率，我们只好采用变通的方法--嵌入汇编、混合编

程。

举例如下，将数组一赋值给数组二，要求每一个字节都相符。char string1[1024],

string2[1024];

方法I

int I;

for (I=0; I<1024; I++)

*(string2+I)=*(string1+I)

方法J

#int I;

for(I=0; I<1024; I++)

*(string2+I)=*(string1+I);

#else

#ifdef_ARM_

_asm

{

MOV R0,string1

MOV R1,string2

MOV R2,#0

loop:

LDMIA R0!,[R3-R11]

STMIA R1!,[R3-R11]

ADD R2,R2,#8

CMP R2, #400

BNE loop

}

#endif

方法I是最常见的方法，使用了1024次循环；方法J则根据平台不同做了区分，在ARM平台

下，用嵌入汇编仅用128次循环就完成了同样的操作。这里有朋友会说，为什么不用标准的

内存拷贝函数呢？这是因为在源数据里可能含有数据为0的字节，这样的话，标准库函数会

提前结束而不会完成我们要求的操作。这个例程典型应用于LCD数据的拷贝过程。根据不同

的CPU，熟练使用相应的嵌入汇编，可以大大提高程序执行的效率。

虽然是必杀技，但是如果轻易使用会付出惨重的代价。这是因为，使用了嵌入汇编，便限

制了程序的可移植性，使程序在不同平台移植的过程中，卧虎藏龙、险象环生！同时该招

数也与现代软件工程的思想相违背，只有在迫不得已的情况下才可以采用。切记。

使用C语言进行高效率编程，我的体会仅此而已。在此已本文抛砖引玉，还请各位高手共同

切磋。希望各位能给出更好的方法，大家一起提高我们的编程技巧。

zh1112ou · 发表于 2007-1-15 19:10:07

顶！

ironman · 发表于 2007-1-15 21:15:57

我没听错吧？用C语言写的程序都是垃圾？？我曰！哪个猪说的！！用汇编写的东西才是绝对的垃圾！！

at90s · 发表于 2007-1-15 21:35:25

方法G

int I,J;

I=257/8;

J=456%32;

方法H

int I,J;

I=257>>3;

J=456-(456>>4<<4);

方法G和方法H是一样的。456-(456>>4<<4)、456%32之类的常数早在编译时就计算好了，我想没有编译器RZ到在运行时计算456-(456>>4<<4)的吧？

dgxll · 发表于 2007-1-16 09:42:32

还是顶一下

TO at90s:

方法G和方法H怎么会是一样的呢,例子所列举的被移位的操作数没有使用变量,编译时编译器当然会计算好,如果使用变量,编译器怎么预先计算好,那编译是你设计的吗???

如果改成这样:

方法G

int I,J;

I=I/8;

J=J%32;

方法H

int I,J;

I=I>>3;

J=J-(J>>4<<4);

先不考虑计算方法有没有错,这样不会提高效率吗,编译器怎么预先算好,麻烦你搞清楚再说
-----此内容被dgxll于2007-01-16,09:44:48编辑过

jintongshuai · 发表于 2007-1-16 12:19:34

at90s · 发表于 2007-1-16 13:25:39

我只是说456-(456>>4<<4)之类的常数会在编译时算好的，可没说J-(J>>4<<4)能在编译时算好。

如果搂主举例子时是用J-(J>>4<<4)的话我无话可说，但用J=456-(456>>4<<4)来说明比J=456%32效率高我就觉得很不合适了。

况且I=I/8; J=J%32; 之类的，编译器也会优化成I>>3和J&0x1f的。

我觉得大多数时候无须人工优化程序，程序的可读性才是重要的，除非有来源于产品实际测试中的证据表明由于某段代码的效率不高使得产品达不到性能指标。

-----此内容被at90s于2007-01-16,13:44:59编辑过

nin_AVR · 发表于 2007-1-16 13:54:23

建議此類經驗之談,做成標準的pdf或者別的文件格式.以便交流.

watercat · 发表于 2007-1-16 14:23:47

话说得难听些

除了“算法优化”，也就是楼主所谓的“第2招：数学方法解决问题”之外

顶楼的帖子通篇就是废话和误导的集合

估计楼主要么是单纯的纸上谈兵，要么就是用的编译器都已经是二十年前货色了，或者干脆就是人云亦云，听风就是雨

这些所谓的“技巧”，楼主真的有用几个不同的C编译器试验过么？真的有认真对比过这些“技巧”使用前后目标码的区别么？

marco2000 · 发表于 2007-1-19 22:01:20

应是不错吧

wwwdege · 发表于 2010-11-29 21:32:39

学习了

stely · 发表于 2010-11-29 22:03:30

标记学习

D402 · 发表于 2012-10-5 23:59:55

方法G
int I,J;
I=I/8;
J=J%32;
方法H
int I,J;
I=I>>3;
J=J-(J>>4<<4);

最后一句应为J=J-(J>>5<<5);
按照二进制来说取余相当于取出相应二进制的后几位
举例来说
456%32 就是 456 & 0b11111
上面的写法是将其移出再移回也就是说二进制的后5位为0 ，然后再减去得到余数，和直接进行与运算的结果是一致的

actshuishan · 发表于 2012-10-6 07:09:31

学习了。

C语言高效编程的几招

阿莫论坛20周年了！感谢大家的支持与爱护！！