GaRY's Blog

Beginning is always beautiful

PHP源代码简单分析 [zt]

原贴地址: http://x-space.discuz.net/space/html/95/22195_itemid_14752.html

当前版本PHP5.1.4

1. 目录结构
   1. build 和编译有关的目录。
   2. ext 扩展库代码,例如 Mysql、zlib、iconv 等我们熟悉的扩展库。
   3. main 主目录。
   4. sapi 和各种服务器的接口调用,例如apache、IIS等,也包含一般的fastcgi、cgi等。
   5. win32 和 Windows 下编译 PHP 有关的脚本。用了 WSH。
   6. Zend 文件夹核心的引擎。

2. PHP使用Lex和Yacc对语法进行解析。
   在 Zend 目录下有两个文件 zend_language_parser.y 与 zend_language_scanner.l 他们是Lex和Yacc的脚本文件,通过这两个脚本文件生成对应的.c和.h文件,实际上这在 linux 下非常普遍,gcc 也使用它们产生语树。

3. PHP如何使用Mysql?
   ext 目录下有一个 mysql 子目录,这个目录中的php_mysql.c 和 php_mysql.h 负责 PHP 与 Mysql 操作。使用了 Mysql 手册中的 C 语言 API。

4. 安全模式?
   main 文件夹下的safe_mode.h 和 safe_mode.c 文件负责PHP的安全模式。
5. 那些是 PHP 的标准函数,那些是扩展函数?
   ext 目录下英文意思是扩展,而在 ext 下还是有一个 standard 文件夹,存放着 PHP 中的标准函数,例如 explode 这个函数是在 ./ext/standard/string.c 下定义的。
6. PHP 源代码中的PHP_FUNCTION(xx) 宏。
   这个宏用来检验一个函数名称是否合法。合法的函数名称应该由小写字母及下划线组成。
7. 那些函数集是标准的?
   通过 ./ext/standard/ 目录我们可以看到以下常用函数集是标准的。字符串函数集、数组函数集、文件及目录操作函数集、md5算法等。
8. 一些函数的实现过程
   1. fsockopen, pfsockopen 的实现
      这两个函数的实现离不开 ./ext/standard/fsock.c 文件中的 php_fsockopen_stream 函数。具体的socket都在./main/network.c 中实现。
9. PHP 函数集注册过程
   在./main/internal_functions.c 中有一个数组 php_builtin_extensions 默认下有以下成员:
  
   1. phpext_bcmath_ptr
   2. phpext_calendar_ptr
   3. phpext_com_dotnet_ptr
   4. phpext_ctype_ptr
   5. phpext_date_ptr
   6. phpext_ftp_ptr
   7. phpext_hash_ptr
   8. phpext_odbc_ptr
   9. phpext_pcre_ptr
   10. phpext_reflection_ptr
   11. phpext_session_ptr
   12. phpext_spl_ptr
   13. phpext_standard_ptr
   14. phpext_tokenizer_ptr
   15. phpext_zlib_ptr
  
   接着 php_register_extensions(php_builtin_extensions, EXTCOUNT TSRMLS_CC) 进行注册
  
10. 有趣的Zend LOGO图片
       ./main/logos.h 文件中,用 zend_logo 与 php_logo 数组保存了 PHP 标志和 Zend 标志。所以你根本在发行包里找不到zend.gif。
11. PHP的语法树?
  
    1. Lex与Yacc
       市面上有这本书。大家可以买来看看,包括GCC都是用它们兄弟生成的语法树。如果对编译器感兴趣。可以翻阅市面上关于这方面的书,并不多就几本。
   
    2. .l与.y语法树文件
       ./Zend/zend_language_scanner.l与./Zend/zend_language_parser.y 规定了PHP的语法。从字面意义上scanner表示语法初步扫描,parser表示语法解析。根据这两个文件lex与yacc可以生成对应的c代码。所以相对来说生成语法是很方便的。
  
    3. 如何定义一个符号
       例如 if($language='php') 这一句中的if 就是一个token 语法中我们用T_IF表示。具体在.l文件中如下定义了:
       

       < ST_IN_SCRIPTING > " if "  {
              
return  T_IF;
      }

      这样.php文件中的if就会被翻译成内置符号T_IF。’(单引号)被如下定义:

       < ST_SINGLE_QUOTE > [ ' ] {
            BEGIN(ST_IN_SCRIPTING);
            return 
' \ '' ;
      }

      
   4. 复合符号例如最常见的变量命名$discuz_user, $submit 等。

       < ST_IN_SCRIPTING , ST_DOUBLE_QUOTES , ST_HEREDOC , ST_BACKQUOTE > " $ " {LABEL} {
            zend_copy_value(zendlval
,  (yytext + 1 ) ,  (yyleng - 1 ));
            zendlval
-> type  =   IS_STRING ;
            
return  T_VARIABLE;
      }

   
   5. 一个有效的if语句过程
      这个定义在zend_language_parser.y 189行:

      T_IF  ' ( '  expr  ' ) '  {
            zend_do_if_cond(
& $ 3 ,   & $ 4  TSRMLS_CC);
      } statement {
            zend_do_if_after_statement(
& $ 4 ,   1  TSRMLS_CC);
      } elseif_list else_single {
            zend_do_if_end(TSRMLS_C);
      }
      
|  T_IF  ' ( '  expr  ' ) '   ' : '  {
            zend_do_if_cond(
& $ 3 ,   & $ 4  TSRMLS_CC);
      } inner_statement_list {
            zend_do_if_after_statement(
& $ 4 ,   1  TSRMLS_CC);
      } new_elseif_list new_else_single T_ENDIF 
' ; '  {
            zend_do_if_end(TSRMLS_C);
      }

      if 后面必须存在(),圆括弧里面是表达式 expr 表达式在734行被定义:

      expr:
            r_variable { $$ 
=  $ 1 ; }
            
|  expr_without_variable { $$  =  $ 1 ; }
      ;


      if 后面可以跟 elseif 语句及 else 语句。
      从语法树里面我们看出 if () 后面是可以跟 : 的,这一般很少被使用吧。

   6. 优先级和左右结合性
      一般情况下.y文件中最先定义的操作符优先级相对低,并且可以使用%left、%right 进行描述左右结合性,例如:

       % left  ' + '   ' - '   ' . '
      
% left  ' * '   ' / '   ' % '
      
% right  ' ! '


      这说明'!'在 PHP 语法中是右结合的, '*' '/' '%' '+' '-' '.' 是左结合的,并且'!'的优先级更高
      例如语法 !$a + $b 要先计算 !$a 在进行加法操作
      %left ',' 被放在最上面定义,说明他的优先级最低,因为我们知道','可以等同一个语句。

   7. php.ini的解析

      1. 如果规定数值正负?

         <  INITIAL  >  [ ]  *  (  "  true  "   |   "  on  "   |   "  yes  "  )[ ]  *   {
              ini_lval 
->  value  .  str  .  val   =   zend_strndup(  "  1  "   ,     1  );
              ini_lval 
->  value  .  str  .  len   =     1  ;
              ini_lval 
->  type   =     IS_STRING  ;
               
return   CFG_TRUE;
      }

       
<  INITIAL  >  [ ]  *  (  "  false  "   |   "  off  "   |   "  no  "   |   "  none  "  )[ ]  *   {
              ini_lval 
->  value  .  str  .  val   =   zend_strndup(  ""   ,     0  );
              ini_lval 
->  value  .  str  .  len   =     0  ;
              ini_lval 
->  type   =     IS_STRING  ;
               
return   CFG_FALSE;
      }

posted on 2006-08-15 15:55 wofeiwo 阅读(768) 评论(0)  编辑 收藏 引用 网摘 所属分类: PHP coreTips


只有注册用户登录后才能发表评论。
网站导航:

导航

<2006年8月>
303112345
6789101112
13141516171819
20212223242526
272829303112
3456789

统计

留言簿(10)

随笔分类(90)

随笔档案(61)

搜索

最新随笔

最新评论