声明式编程范式初探

语言编程语言可以分成两类：

命令式
声明式

事实上，凡是非命令式的编程都可归为声明式编程。因此，命令式、函数式和逻辑式是最核心的三种范式。为清楚起见，我们用一幅图来表示它们之间的关系。

编程范式的简单分类

与命令式编程相对的声明式编程（ declarative programming ）。顾名思义，声明式编程由若干规范（ specification ）的声明组成的，即一系列陈述句：‘已知这，求解那’，强调‘做什么’而非‘怎么做’。声明式编程是人脑思维方式的抽象，即利用数理逻辑或既定规范对已知条件进行推理或运算。

声明式编程的发源

声明式编程发轫于人工智能的研究，主要包括函数式编程（ functional programming ，简称 FP ）和逻辑式编程（ logic programming ，简称 LP ）。其中，函数式编程将计算描述为数学函数的求值，而逻辑式编程通过提供一系列事实和规则来推导或论证结论。

其实支持它们的语言出现得并不比命令式的晚多少——最早的函数式语言 Lisp （ LISt Processor ）已有半个世纪的历史，最早之一的逻辑式语言 Prolog （ PROgramming in LOGic ）也与 C 同龄。只是由于大多数更多地用于学术研究而非商业应用，颇有些‘养在深闺人未识’的味道。

起源的不同决定了这两大类范式代表着迥然不同的编程理念和风格：命令式编程是行动导向（ Action-Oriented ）的，因而算法是显性而目标是隐性的；声明式编程是目标驱动（ Goal-Driven ）的，因而目标是显性而算法是隐性的。为便于说明，我们分别用三种代表性的语言来实现阶乘（ factorial ）运算。

阶乘的三种编程实现

C(命令式) –

int factorial(int n) 
{
	int f = 1;
	for (; n > 0; --n) f *= n;
	return f;
}

Liap(函数式) –

(defun factorial(n)
  (if (= n 0)
	1                               //  若n等于0，则n!等于1
	(* n (factorial(- n 1)))))      //  否则n!等于n* (n-1)

Prolog(逻辑式) –

// 0! 等于1
factorial(0,1).
// 若M等于N-1且 M!等于Fm且F等于N*Fm，则N! 等于F
factorial(N,F) :-   M is N-1, factorial(M,Fm), F is N * Fm.

以上三段代码区别在哪里？ C 明确给出了阶乘的迭代算法，而 Lisp 仅描述了阶乘的递归定义， Prolog 则陈述了两个关于阶乘的断言。

声明式编程的本质

我们最早接触的变量是代数方程中的 x、y、z 等，本质上是抽象化的符号，变量值是该符号在给定约束条件下的允许值。而命令式编程中的变量本质上是抽象化的内存，变量值是该内存的储存内容。通俗地说，前者好比姓名，所指之人是固定的；后者好比住址，所住之人是变化的。此外，等号在代数中是一种约束，而在许多命令式语言中则表示赋值。因此 i = i + 1 可以在命令式编程中出现，但绝不可能在数学推理中出现 —— 除非在反证法中。

声明式编程让我们重回数学思维：函数式编程类似代数中的表达式变换和计算，逻辑式编程则类似数理逻辑推理。其中的变量也如数学中的一样，是抽象符号而非内存地址，因此没有赋值运算，不会产生变量被改写的副作用（ side-effect ），也不存在内存分配和释放的问题。这既简化了代码，也减少了调试——不妨想一想，有多少bug是由于某个变量被意外改写或内存管理不慎而造成的？

声明式语言与命令式语言的相通之处

首先，所有高级语言都建立于低级语言之上，最终转化为机器语言，声明式语言也不例外。
其次，声明式语言与命令式语言并非泾渭分明，而是互相交叉渗透的。一些‘非纯粹’ 的声明式语言也提供变量赋值和流程控制，而一些命令式语言也在逐渐发展，通过利用其他程序或增加新的语言特征来实现声明式编程。

总的说来，在命令式语言中融入声明式的元素应当是一种趋势。尤其是函数式，它的一些特征已经在许多命令式语言中得到了支持。比较而言，声明式编程重目标、轻过程，专注问题的分析和表达而不致陷入算法的迷宫，其代码也更加简洁清晰、易于修改和维护。从这种意义上说，声明式语言天然地就比命令式语言更高级。

既然声明式编程有这么多好处，为什么命令式语言不仅占大多数，而且流行程度也不减呢？

编程语言的流行程度与其擅长的领域关系密切。声明式语言——尤其是函数式语言和逻辑式语言——擅长基于数理逻辑的应用，如人工智能、符号处理、数据库、编译器等，对基于业务逻辑的、尤其是交互式或事件驱动型的应用就不那么得心应手了。而大多数软件是面向用户的，交互性强、多为事件驱动、业务逻辑千差万别，显然命令式语言在此更有用武之地。

值得指出的是，声明式编程并不仅仅局限于函数式和逻辑式。比方说， C# 中的 attribute 、 Java 中的 annotation 和 XDoclet 库等采用的也是具有声明式特征的属性导向式编程（ Attribute-Oriented Programming ，简称 @OP ）。再比如， Prograph 、 SISAL 等数据流语言（ dataflow language ）采用的数据流式编程（ Dataflow Programming ）与函数式编程有不少共同点，同样属于声明式的范畴。还有一些语言如 Oz 、 CHIP 等支持与逻辑式编程相交的约束式编程（ Constraint Programming ）。此外，大家熟悉的数据库语言 SQL ，样式语言 XSLT、 CSS，标记语言 HTML 、 XML 、 SVG ，规范语言 IDL （ Interface Description Language ）等等都是声明式的。算上它们，声明式语言所占的比例也是非常可观的。此前之所以没有提及，一方面，不少声明式语言采用的范式并没有专门的名称；另一方面，这些语言大多是领域特定语言，并且不少并非图灵完备的，有的连运算都没有。毕竟，目前我们的重点还是放在通用编程语言上。

其实用 Lisp 实现阶乘的方法也可以用在 C 上：

int factorial(int n) 
{
    return n == 0 ? 1 : n * factorial(n - 1);
}

这是 C 的递归实现。除了细微的语法差别外，二者的确很相似，这说明用命令式语言也可以讲出声明式的味道。实际上，命令式语言提倡迭代而不鼓励递归，早期的 Fortran 甚至都不支持递归。一则迭代比递归更符合命令式的思维模式，因为前者贴近机器语言而后者贴近数学语言；二则除尾递归（ tail recursion ）外，一般递归比迭代的开销（ overhead ）大。相反，声明式语言提倡递归而不支持迭代。就语法而言，它不允许迭代中的循环变量；就视角而言，迭代着眼微观过程而递归着眼宏观规律。

归根结底，编程是寻求一种机制，将指定的输入转化为指定的输出。三种范式对此提供了截然不同的解决方案：

命令式把程序看作一个自动机，输入是初始状态，输出是最终状态，编程就是设计一系列指令，通过自动机执行以完成状态转变；
函数式把程序看作一个数学函数，输入是自变量，输出是因变量，编程就是设计一系列函数，通过表达式变换以完成计算；
逻辑式把程序看作一个逻辑证明，输入是题设，输出是结论，编程就是设计一系列命题，通过逻辑推理以完成证明。

绘成表格如下：

范式	程序	输入	输出	程序设计	程序运行
命令式	自动机	初始状态	最终状态	设计指令	命令执行
函数式	数学函数	自变量	因变量	设计函数	表达式变换
逻辑式	逻辑证明	题设	结论	设计命题	逻辑推理