16、Elixir中的Dialyzer：类型检查与错误检测

week9

于 2025-11-27 15:17:31 发布

阅读量1

点赞数

CC 4.0 BY-SA版权

分类专栏： Elixir并发编程精要文章标签： Elixir Dialyzer 类型检查

本文链接：https://blog.youkuaiyun.com/week9/article/details/155409528

Elixir并发编程精要专栏收录该内容

19 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

Elixir中的Dialyzer：类型检查与错误检测

在软件开发中，确保代码的可靠性和稳定性是至关重要的。对于Elixir这样的动态类型语言，虽然开发周期可能更快，但也可能在运行时出现各种类型错误。Dialyzer是一个强大的工具，它可以帮助我们在编译前发现代码中的潜在问题，提高代码的质量。本文将详细介绍Dialyzer的工作原理、使用方法以及它能检测到的软件差异。

1. Elixir集群搭建

首先，我们可以在局域网中搭建一个Elixir集群。以下是连接两个节点的示例代码：

iex(one@192.168.0.100)1> Node.connect :'two@192.168.0.103'
true
iex(one@192.168.0.100)2> Node.list
[:"two@192.168.0.103"]

通过上述代码，我们成功将 one@192.168.0.100 连接到 two@192.168.0.103 ，并使用 Node.list/0 函数验证了连接结果。

2. 分布式应用的重要性

在期望能在崩溃中存活的应用程序中，实现适当的故障转移和接管机制至关重要。与许多语言和平台不同，OTP内置了故障转移和接管功能。在分布式应用开发中，我们需要关注以下几个方面：
- 实现展示故障转移和接管的分布式应用
- 配置故障转移和接管
- 将节点连接到局域网
- 使用cookie

3. Dialyzer简介

Dialyzer是一个随Erlang发行版一起提供的工具，全称为“DIscrepancy Analyze for ERlang”。它可以帮助我们找出代码中的差异，包括以下几类问题：
- 类型错误
- 引发异常的代码
- 无法满足的条件
- 冗余代码
- 竞态条件

静态语言可以在编译时捕获潜在错误，而动态语言只能在运行时检测到这些错误。Dialyzer试图将静态类型检查器的一些优点引入到像Elixir/Erlang这样的动态语言中。它的主要目标之一是不妨碍现有程序，即不需要为了使用Dialyzer而重写代码。

4. 成功类型推断

Dialyzer使用成功类型推断（Success Typings）来收集和推断类型信息。为了理解成功类型推断，我们需要了解一些Elixir的类型系统。

以布尔 and 函数为例，在静态语言Haskell中， and 函数的实现如下：

and :: Bool -> Bool -> Bool
and x y | x == True && y == True = True
        | otherwise = False

而在Elixir中， and 函数可以通过模式匹配实现：

defmodule MyBoolean do
  def and(true, true) do
    true
  end
  def and(false, _) do
    false
  end
  def and(_, false) do
    false
  end
end

在Elixir中，函数可以接受多种类型的参数，这使得类型系统更加宽松。Dialyzer使用的成功类型推断算法是乐观的，它总是假设所有函数都被正确使用。该算法首先对函数的输入和输出进行过度近似，然后随着对代码的理解加深，生成约束条件。最后，通过解决这些约束条件来得到函数的成功类型。

需要注意的是，Dialyzer不能保证代码的类型安全，但如果它发现了问题，那么代码肯定存在问题。

5. 揭示Elixir中的类型

在Elixir中，我们可以使用 i/1 和 t/1 两个辅助函数来查看类型信息。
- 使用 i/1 ：从Elixir 1.2开始， i/1 函数可以打印给定数据类型的信息。例如：

iex> i("ohai")
Term
  "ohai"
Data type
  BitString
Byte size
  4
Description
  This is a string: a UTF-8 encoded binary. It's printed surrounded by
  "double quotes" because all UTF-8 codepoints in it are printable.
Raw representation
  <<111, 104, 97, 105>>
Reference modules
  String, :binary

iex> i('ohai')
Term
  'ohai'
Data type
  List
Description
  This is a list of integers that is printed as a sequence of codepoints
  delimited by single quotes because all the integers in it represent 
valid
  ascii characters. Conventionally, such lists of integers are referred 
to as
  "char lists".
Raw representation
  [111, 104, 97, 105]
Reference modules
  List

使用 t/1 ： t/1 函数可以打印给定模块或函数/元数对的类型信息。例如：

iex> t Enum
@type t() :: Enumerable.t()
@type element() :: any()
@type index() :: non_neg_integer()
@type default() :: any()

iex> t Enumerable
@type acc() :: {:cont, term()} | {:halt, term()} | {:suspend, term()}
@type reducer() :: (term(), term() -> acc())
@type result() :: {:done, term()} | {:halted, term()} | {:suspended, 
term(), continuation()}
@type continuation() :: (acc() -> result())
@type t() :: term()

6. 开始使用Dialyzer

在使用Dialyzer之前，我们需要先进行 mix compile 。Dialyzer可以使用Erlang源代码或调试编译的BEAM字节码，这里我们选择后者。

6.1 持久查找表（PLT）

Dialyzer使用持久查找表（PLT）来存储分析结果。对于非平凡的Elixir应用程序，由于可能涉及OTP，运行Dialyzer的分析时间可能会很长。因此，我们可以构建一个基础PLT，只对应用程序运行Dialyzer，这样可以节省时间。但在升级Erlang和/或Elixir时，需要记得重建PLT。

如果第一次运行 dialyzer ，可能会出现找不到PLT的错误：

% dialyzer
  Checking whether the PLT /Users/benjamintan/.dialyzer_plt is up-to-date...
dialyzer: Could not find the PLT: /Users/benjamintan/.dialyzer_plt
Use the options:
   --build_plt   to build a new PLT; or
   --add_to_plt  to add to an existing PLT
For example, use a command like the following:
   dialyzer --build_plt --apps erts kernel stdlib mnesia

我们可以使用 --build_plt 选项构建一个新的PLT，或者使用 --add_to_plt 选项向现有PLT中添加内容。

6.2 Dialyxir的使用

为了简化Dialyzer的使用，我们可以使用Dialyxir。它包含了一些 mix 任务，让在Elixir项目中使用Dialyzer变得更加轻松。

以下是安装Dialyxir的步骤：

% git clone https://github.com/jeremyjh/dialyxir
% cd dialyxir
% mix archive.build
% mix archive.install

6.3 构建PLT

使用Dialyxir构建PLT的命令如下：

% mix dialyzer.plt

构建PLT可能需要一些时间，构建完成后，即使出现“Unknown types”等警告，只要PLT构建成功，就可以继续使用。

7. Dialyzer能检测到的软件差异

为了演示Dialyzer的功能，我们创建一个简单的货币转换器项目：

% mix new dialyzer_playground

然后在 mix.exs 文件中添加Dialyxir依赖：

defmodule DialyzerPlayground.Mixfile do
  # ...
  defp deps do
    [{:dialyxir, "~> 0.3", only: [:dev]}]
  end
end

运行 mix deps.get 获取依赖后，我们就可以开始测试了。

7.1 捕获类型错误

以下是一个会产生类型错误的示例代码：

defmodule Cashy.Bug1 do
  def convert(:sgd, :usd, amount) do
    {:ok, amount * 0.70}
  end
  def run do
    convert(:sgd, :usd, :one_million_dollars)
  end
end

运行 mix dialyzer 后，Dialyzer会输出以下错误信息：

bug_1.ex:7: Function run/0 has no local return
bug_1.ex:8: The call 
'Elixir.Cashy.Bug1':convert('sgd','usd','one_million_dollars') will never 
return since it differs in the 3rd argument from the success typing 
arguments: ('sgd','usd',number())

这表明 convert/3 函数的第三个参数应该是一个数字，但实际传入的是一个原子，会导致 ArithmeticError 。

7.2 发现内置函数的错误使用

以下代码展示了如何错误使用内置函数：

defmodule Cashy.Bug2 do
  def convert(:sgd, :usd, amount) do
    {:ok, amount * 0.70}
  end
  def convert(_, _, _) do
    {:error, :invalid_amount}
  end
  def run(amount) do
    case convert(:sgd, :usd, amount) do
      {:ok, amount} ->
        IO.puts "converted amount is #{amount}"
      {:error, reason} ->
        IO.puts "whoops, #{String.to_atom(reason)}"
    end
  end
end

运行 mix dialyzer 后，会得到以下错误信息：

bug_2.ex:18: The call 
erlang:binary_to_atom(reason@1::'invalid_amount','utf8') breaks the 
contract (Binary,Encoding) -> atom() when is_subtype(Binary,binary()), 
is_subtype(Encoding,'latin1' | 'unicode' | 'utf8')

这说明 String.to_atom/1 的使用导致了问题，应该使用 Atom.to_string/1 代替。

7.3 定位冗余代码

以下代码存在冗余代码：

defmodule Cashy.Bug3 do
  def convert(:sgd, :usd, amount) when amount > 0 do
    {:ok, amount * 0.70}
  end
  def run(amount) do
    case convert(:sgd, :usd, amount) do
      amount when amount <= 0 -> 
        IO.puts "whoops, should be more than zero"
      _ ->
        IO.puts "converted amount is #{amount}"
    end
  end
end

运行 mix dialyzer 后，会输出：

bug_3.ex:9: Guard test amount@2::{'ok',float()} =< 0 can never succeed

这表明由于 convert/3 函数中有 amount > 0 的守卫子句， amount <= 0 的情况永远不会发生，这部分代码是冗余的。

7.4 发现守卫子句中的类型错误

以下代码在守卫子句中存在类型错误：

defmodule Cashy.Bug4 do
  def convert(:sgd, :usd, amount) when is_float(amount) do
    {:ok, amount * 0.70}
  end
  def run do
    convert(:sgd, :usd, 10)
  end
end

运行 mix dialyzer 后，会得到以下错误信息：

bug_4.ex:7: Function run/0 has no local return
bug_4.ex:8: The call 'Elixir.Cashy.Bug4':convert('sgd','usd',10) will never 
return since it differs in the 3rd argument from the success typing 
arguments: ('sgd','usd',float())

这说明 10 不是 float 类型，无法通过守卫子句。

7.5 间接调用导致Dialyzer失效

以下代码通过添加一层间接调用，使得Dialyzer无法检测到错误：

defmodule Cashy.Bug5 do
  def convert(:sgd, :usd, amount) do
    amount * 0.70 
  end
  def amount({:value, value}) do
    value
  end
  def run do
    convert(:sgd, :usd, amount({:value, :one_million_dollars}))
  end
end

运行 mix dialyzer 后，结果显示通过，说明Dialyzer在处理间接调用时可能会失效。

综上所述，Dialyzer是一个非常有用的工具，可以帮助我们在编译前发现代码中的潜在问题。但它也有一定的局限性，例如在处理间接调用时可能无法检测到错误。在实际开发中，我们可以将Dialyzer集成到开发工作流中，提高代码的质量和可靠性。

Elixir中的Dialyzer：类型检查与错误检测

8. 总结Dialyzer的优势与局限

9. 深入理解成功类型推断

为了更深入地理解成功类型推断，我们可以通过一个流程图来展示其工作流程：

graph TD;
    A[开始] --> B[过度近似函数输入输出];
    B --> C[分析代码生成约束条件];
    C --> D[解决约束条件];
    D --> E{是否有解};
    E -- 有解 --> F[得到成功类型];
    E -- 无解 --> G[类型违规];

成功类型推断从过度近似函数的输入和输出开始，随着对代码的分析，逐渐生成约束条件。这些约束条件就像拼图的碎片，需要被解决以得到函数的成功类型。如果无法找到解决方案，就意味着存在类型违规。

10. 实际项目中使用Dialyzer的最佳实践

在实际项目中，为了充分发挥Dialyzer的作用，我们可以遵循以下最佳实践：
- 定期构建和更新PLT ：随着项目的发展和依赖的更新，定期构建和更新PLT可以确保Dialyzer的分析结果准确。例如，在升级Erlang或Elixir版本后，及时重建PLT。
- 集成到持续集成（CI）流程 ：将 mix dialyzer 命令添加到CI流程中，每次代码提交时自动运行Dialyzer，及时发现代码中的问题。
- 逐步添加类型信息 ：虽然Dialyzer不需要额外的类型信息就能工作，但在代码中逐步添加类型信息可以帮助它更好地检测问题。例如，使用类型规范来明确函数的输入和输出类型。

11. 对比不同类型检查方法

12. 案例分析：Dialyzer在大型项目中的应用

假设我们有一个大型的Elixir项目，包含多个模块和复杂的业务逻辑。在项目开发初期，由于没有使用Dialyzer，经常在运行时出现类型错误，导致程序崩溃。后来，我们引入了Dialyzer，并遵循以下步骤进行优化：
1. 构建PLT ：使用 mix dialyzer.plt 命令构建持久查找表，为后续的分析提供基础。
2. 集成到开发流程 ：将 mix dialyzer 命令添加到每次代码提交的检查流程中，确保每次提交的代码都经过Dialyzer的检查。
3. 添加类型信息 ：在关键模块和函数中添加类型规范，帮助Dialyzer更准确地检测问题。

通过这些措施，我们发现项目中的类型错误明显减少，代码的稳定性和可靠性得到了显著提升。同时，由于Dialyzer的分析时间通过PLT得到了优化，并没有对开发效率造成太大影响。

13. 未来展望

随着Elixir和Erlang社区的不断发展，Dialyzer也可能会得到进一步的改进和优化。未来，我们可以期待它在以下方面有所突破：
- 增强对间接调用的检测能力 ：解决当前在处理间接调用时可能失效的问题，提高错误检测的全面性。
- 更好的错误提示 ：提供更清晰、易懂的错误信息，帮助开发者更快地定位和解决问题。
- 与其他工具的集成 ：与更多的开发工具和框架集成，进一步提升开发体验。

总之，Dialyzer是Elixir开发中一个不可或缺的工具，它为我们提供了一种有效的方式来提高代码的质量和可靠性。虽然它存在一定的局限性，但通过合理的使用和不断的优化，我们可以充分发挥它的优势，让开发过程更加顺畅。