PHP內核探索 —— 解釋器的執行過程:引擎是如何執行PHP代碼的
這里將介紹引擎內部執行一個PHP腳本的流程,以CLI SAPI為例子來對流程中核心的部分做簡單介紹,省去一些初始化及清理操作。
CLI(Command Line Interface)即PHP的命令行模式,現在此SAPI是默認安裝的,我們在服務器上安裝完PHP之后,一般會生成一個可執行文件,假設此文件為/usr/local/bin/php?,那么我們在SHELL下可以用以下命令來執行一個PHP腳本:
/usr/local/bin/php -f test.php
這個命令將執行當前目錄下的test.php腳本,我們暫且不關心test.php具體內容,只關心一下這個執行的內部過程是怎么樣的。
CLI的主源代碼文件在{PHPSRC}/sapi/cli/php_cli.c,整個過程就從這個文件中的 main()函數執行,整個函數比較長,主要可以分為以下幾個階段:
解析命令行參數初始化環境編譯執行PHP代碼清理環境并返回退出在第1個階段中,解析-f參數為執行一個PHP文件,-f后面的test.php就是需要被執行的文件。
這里我們將關注第3個階段,如何執行test.php中的PHP代碼。
最終是通過php_execute_script(&file_handle TSRMLS_CC)來執行PHP的腳本,這個函數定義在{PHPSRC}/main/main.c,原型為
PHPAPI int php_execute_script(zend_file_handle *primary_file TSRMLS_DC)
file_handle的類型為zend_file_handle,這個是zend對文件句柄的一個封裝,里面的內容就是和test.php相關的了。
php_execute_script最終是調用的zend_execute_scripts,這個函數定義在{PHPSRC}/Zend/zend.c,原型為:
ZEND_API int zend_execute_scripts(int type TSRMLS_DC, zval **retval, int file_count, ...)
此函數具有可變參數,可以一次執行多個PHP文件,在此函數中最核心的是調用zend_compile_file和zend_execute,zend_compile_file是一個函數指針,其聲明在{PHPSRC}/Zend/zend_compile.c:
ZEND_API zend_op_array *(*zend_compile_file)(zend_file_handle *file_handle, int type TSRMLS_DC);
在引擎初始化的時候,會將compile_file函數的地址賦值給zend_compile_file,compile_file函數定義在{PHPSRC}/Zend/zend_language_scanner.c,通過聲明可以看到這個函數以zend_file_handle指針作為參數,返回一個指向zend_op_array的指針。
zend_execute也是一個函數指針,其聲明在{PHPSRC}/Zend/zend_execute.c:
ZEND_API extern void (*zend_execute)(zend_op_array *op_array TSRMLS_DC);
同樣在引擎初始化的時候,會將execute函數的地址賦值給zend_execute,execute的定義在{PHPSRC}/Zend/zend_vm_execute.h。
通過聲明知道zend_execute以一個指向zend_op_array結構的指針作為參數,這個指針即前面zend_compile_file的返回值,zend_execute就開始執行op_array中的opcode,在執行opcode的過程中,就實現了PHP語言的各種功能。
到這里主要的執行工作基本就完成。
PS:為什么要把zend_execute和zend_compile_file定義為函數指針?
在引擎初始化(zend_startup)的時候,將zend_execute指向了默認的execute,zend_compile_file指向了默認的compile_file。我們可以在實際編譯和執行之前將zend_execute和zend_compile_file重寫為其他的編譯和執行函數,這樣就為我們擴展引擎留下了鉤子,比如一個比較有名的查看PHP的opcode的擴展vld(http://www.derickrethans.nl/projects.html#vld),此擴展就是在每次請求初始化的鉤子函數(PHP_RINIT_FUNCTION)中,將zend_execute和zend_compile_file替換成自己的vld_execute和vld_compile_file,這兩個函數其實是對原始函數進行了封裝,添加了輸出opcode信息的附加功能,因為引擎初始化是發生在模塊請求初始化之前,而模塊請求初始化又是在編譯和執行之前,所以這樣的覆蓋能達到目的。
相關文章: