php解析bt,PHP基于闭包思想实现的BT(torrent)文件解析工具实例详解

最新推荐文章于 2021-04-07 18:39:09 发布

转载最新推荐文章于 2021-04-07 18:39:09 发布 · 201 阅读

文章标签：

#php解析bt

本文详细介绍了如何使用PHP的闭包思想解析torrent文件，探讨了静态词法域的使用、引用传递和类实现的方案。作者通过实例展示了如何构造解析器并处理B-Encoding格式，以及类Scheme风格函数式编程的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文实例讲述了PHP基于闭包思想实现的torrent文件解析工具。分享给大家供大家参考，具体如下：

PHP对静态词法域的支持有点奇怪，内部匿名函数必须在参数列表后面加上use关键字，显式的说明想要使用哪些外层函数的局部变量。

function count_down($count)

{

return $func = function()

use($count,$func)

{

if(--$count > 0)

$func();

echo "wow

};

}

$foo = count_down(3);

$foo();

我本来是想这样的。但是不行，会在第7行调用$func的时候报错。

错误是Fatal error: Function name must be a string in - on line 7

反复试验后发觉，外部的匿名函数应该通过引用传值传给内部，否则是不行的：

function count_down($count)

{

return $foo = function()

use(&$count,&$foo)

{

echo $count."

if(--$count > 0)

$foo();

};

}

$foo = count_down(4);

$foo();

像上面这样写就对了。

下面是另一种方法：

function count_down_again($count)

{

return function()use($count)

{

printf("wow %d

",$count);

return --$count;

};

}

$foo = count_down_again(5);

while($foo() >0);

不过，这段代码有点小错误。编译虽然没错，但是$foo函数每次返回的都是4.

也就是use关键字看上去像是支持静态词法域的，在这个例子上，它只是对外层函数使用的变量作了一个简单拷贝。

让我们稍微修改一下，把第3行的use($count)改为use(&$count)：

function count_down_again($count)

{

return function()use(&$count)

{

printf("wow %d

",$count);

return --$count;

};

}

$foo = count_down_again(5);

while($foo() >0);

这样才正确。

我个人使用的方式是基于类的，做成了类似下面的形式：

class Foo

{

public function __invoke($count)

{

if($count > 0)

$this($count - 1);

echo "wow

}

$foo = new Foo();

$foo(4);

这样做的行为也是正确的。

这样不会像前一个例子那样失去了递归调用的能力。

虽然这是一个类，但是只不过是在手动实现那些支持闭包和静态词法域的语言中，编译器自动实现的动作。

其实今天早上，我本来准备用类scheme的风格写一个解析器的。可能稍微晚点吧。scheme风格的函数式编程是这样的：

function yet_another_count_down($func,$count)

{

$func($count);

if($count > 0)

yet_another_count_down($func,$count - 1);

}

yet_another_count_down(function($var){echo $var."

";},6);

它不是很依赖静态词法域，虽然scheme对静态词法域的支持还是很不错的。它主要还是利用了first-class-function。当然，这也是一种典型的闭包。

我实现的torrent解析工具的代码如下：

$file_name = "1.torrent";

$file = fopen($file_name,"r");

$nil = new Parser($file);//构造解析器

$nil = $nil();//进行解析

$pos = ftell($file);

echo "读取到文件位置".sprintf("0x%08X",$pos)."

fseek($file,0,SEEK_END);

echo "还剩下".(ftell($file) - $pos)."字节未读取"."

if(!feof($file))

{

echo "文件还未结束，再读一个字符:";

$ch = fgetc($file);

if(is_string($ch) && ereg("w",$ch))

{

echo $ch."

}

else

{

printf("0x%02X",$ch);

echo "

}

echo "现在的文件位置是".sprintf("0x%08X",ftell($file))."

echo "文件".(feof($file)?"已结束":"还未结束")."

}

fclose($file);//解析器后面不再工作了，此时可以释放文件指针了。

$info = @$nil["value"][0]["info"];

if(!$info)

{

echo "这是一个有效的B-Encoding文件，但它不是一个有效的种子文件";

exit();

}

$name = $info["name.utf-8"] ?$info["name.utf-8"]:$info["name"];

if(!$name)

{

echo "这是一个有效的B-Encoding文件，但它不是一个有效的种子文件";

exit();

}

echo $name."

if($info["files"])

{

$index = 0;

foreach($info["files"] as $f)

{

$index += 1;

$path = $f["path.utf8"] ?$f["path.utf8"] :$f["path"];

if(!$path)

{

echo "文件列表中的第".$index."个文件不含目录

continue;

}

if(0 === strpos($path[0],"_____padding_file_"))continue;

$under_folder = false;

foreach($path as $item)

{

if($under_folder)

{

echo "/";

}else{

$under_folder = true;

}

echo $item;

}

echo "

}

else

{

echo "仅有一个文件

}

class Parser

{

private $_file;

public function __construct($file)

{

$this ->_file = $file;

}

public function __invoke($parent = array())

{

$ch = $this ->read();

switch($ch)

{

case "i":

{

$n = $ch;

while(($ch = $this ->read()) != "e")

{

if(!is_numeric($ch))

{

echo "在";

echo sprintf(

"0x%08X",ftell($this ->_file));

echo "解析数字时遇到错误","

echo "在i和e之间不应该出现非数字字符"."

echo "意外的字符".sprintf("0x%02X",$ch);

exit();

}

else

{

$n .= $ch;

}

$n += 0;

$offset = count($parent["value"]);

$parent["value"][$offset] = $n;

return $parent;

}

break;

case "d":

{

$node = array();

//这个$node变量作为字典对象准备加入到$parent的孩子节点中去

//$node["type"] = "d";

while("e" != ($tmp = $this($node)))

{//每次给$node带来一个新孩子

$node = $tmp;

}

$child_count = count($node["value"]);

if($child_count % 2 != 0)

{

echo "解析结尾于";

echo sprintf("0x%08X",ftell($this ->_file));

echo "的字典时遇到错误:"."

echo "字典的对象映射不匹配";

exit();

}

$product = array();

for($i = 0; $i < $child_count; $i += 2)

{

$key = $node["value"][$i];

$value = $node["value"][$i + 1];

if(!is_string($key))

{

echo "无效的字典结尾于";

echo sprintf("0x%08X",ftell($this ->_file));

echo ":

echo "解析[k => v]配对时遇到错误，k应为字符串";

exit();

}

$product[$key] = $value;

}

* 思想是这样的：子节点想要加入父节点时，

* 往父节点的value数组添加。

* 当父节点收集好所需的信息后，

* 父节点自身再从它的value节点整合内容

* 对于字典和列表统一这样处理会大大降低代码量

$offset = count($parent["value"]);

$parent["value"][$offset] = $product;

return $parent;

}

break;

case "l";

{

$node = array();

while("e" != ($tmp = $this($node)))

{

$node = $tmp;

}

$offset = count($parent["value"]);

$parent["value"][$offset] = $node["value"];

return $parent;

}

break;

case "e":

return "e";

break;

default:

{

if(!is_numeric($ch))

{

$this ->unexpected_character(

ftell($this ->_file) - 1,$ch);

}

$n = $ch;

while(($ch = $this ->read()) != ":")

{

$n .= $ch;

if(!is_numeric($n))

{

unexpected_character(

ftell($this ->_file) - 1,$ch);

}

$n += 0;

$str = "";

for(; $n > 0; --$n)

{

$str .= $this ->read();

}

$offset = count($parent["value"]);

$parent["value"][$offset] = $str;

return $parent;

}

break;

}

* read函数包裹了$this ->_file变量

function read()

{

if(!feof($this ->_file))

{

return fgetc($this ->_file);

}else{

echo "意外的文件结束";

exit();

}

* unexpected_character函数接收2个参数

* 它用于指明脚本在何处遇到了哪个不合法的字符，

* 并在返回前终止脚本的运行。

function unexpected_character($pos,$val)

{

$hex_pos = sprintf("0x%08X",$pos);

$hex_val = sprintf("0x%02X",$val);

echo "Unexpected Character At Position ";

echo $hex_pos." , Value ".$hex_val."

echo "Analysing Process Teminated.";

exit();

}

这里很有趣的是，明明我对文件调用了fseek($file,0,SEEK_END);移动到文件末尾了，但是feof还是报告说文件没有结束，并且fgetc返回一个0，而没有报错。但是此时文件实际上已经到末尾了。

更多关于PHP相关内容感兴趣的读者可查看本站专题：《php curl用法总结》、《php字符串(string)用法总结》、《PHP数组(Array)操作技巧大全》、《php排序算法总结》、《PHP常用遍历算法与技巧总结》、《PHP数据结构与算法教程》、《php程序设计算法总结》、《PHP数学运算技巧总结》及《PHP运算与运算符用法总结》、

希望本文所述对大家PHP程序设计有所帮助。