前言
LAMP
LAMP(Linux-Apache-MySQL-PHP)网站架构是目前国际流行的Web框架,该框架包括:Linux操作系统,Apache网络服务器,MySQL数据库,Perl、PHP或者Python编程语言,所有组成产品均是开源软件,是国际上成熟的架构框架,很多流行的商业应用都是采取这个架构,和Java/J2EE架构相比,LAMP具有Web资源丰富、轻量、快速开发等特点,微软的.NET架构相比,LAMP具有通用、跨平台、高性能、低价格的优势,因此LAMP无论是性能、质量还是价格都是企业搭建网站的首选平台。
正文
L-Linux
Linux这个操作系统大家都再熟悉不过了、种类很多、版本也很多、各色各样的什么款的都有、看个人喜欢而选择、这里我们选用CentOS 6.5来说明问题。
A-Apache
apache是什么玩意呢。
其实apache早期是美国的一个官方组织所研发的一款web服务器、早期也就叫httpd、但是这个项目完成了之后、功能也很完善了、所以、大家都知道、一旦某个项目完成了之后就要解散组织了、那这些研发httpd的程序员就散发到各个软件公司了、这些程序又都很喜欢这个软件、不想让自己的成果就这样没落了、httpd就像这些程序员的孩子一个、不想没人管、于是他们就通过网络互相组织起来维护这款web服务器、一旦发现有漏洞、就打补丁、需要新功能就开发、自发的组织起来、这就是早期的社区模型、所以在早期的httpd的基础上给他打了很多的补丁、使得这个服务器的功能越来越强大、所以他们就把这个服务器称为充满补丁的服务器(a pachey server)、后来、美国的武装攻击直升机叫apache、所以后来这个httpd服务器就叫apache了。
自从apache出现之后、绝对是一个疯狂的时期、出现后不久就迅速获得了从们的青睐、因为他是开源软件、被各家组织和公司所使用、可以到下面这个网站看看apache的市场占有比例。
httpd其实是一种高度模块化设计的、所以通常由核心和各种模块所组成、这跟内核很相近、这个软件也是由核心和各种外围模块组成的、核心可以理解为http的基本接收请求响应请求等、而模块可以理解为:比如说一个用户请求一个很大的页面、那我们就想压缩给客户发送、那这个压缩功能就是一个模块、这种就是httpd的模块分设计、他的模块功能很多、这里就不一一例举了、而通常又称为DSO(Dynamic Shared Object)模型、动态模块对象或动态共享对象、用得着模块就装载模块、即使编译了用不着也可以不让模块被装载。
httpd还有一个叫MP的机制(Multipath Processing Module)多道处理模块、是httpd的一个特性、他不是一个模块、是一种特性统称、常用的模块有:prefork、worker、event
prefork:叫预fork、他的工作机制是一个进程响应一个请求
worker:一个进程生成多个线程、一个线程响应一个请求
event:这是真正意义上的单线程响应多个请求、而且要基于事件驱动
这里不再详细讲述、前面的文章中我们已经详细谈过这个问题、可以参数前面的文章:总结之:CentOS 6.5 HTTPD服务的全面解读及配置详解(1)
M-mysql
一个关系型数据库的基本结构到底是怎么样的呢:
1、在最底层表现为两类文件:一类叫数据文件、用户可能看到的是数据、但我们最终要存放到文件中、另一类叫索引文件、索引其实是表中数据的一部分、只是把一某些字段抽取出来单独做成一个文件给他排好序、对查找数据有很大的提升、但写性能降底了、这是在物理层面上实现的两类文件、这些个文件也是存放在某个目录当中的、对mysql而言、数据库表现为单个目录。
2、磁盘空间管理器:磁盘管理器是对数据文件内部数据组织结构管理的工具、对数据来讲、为了持久存储、数据都在磁盘上、但是我们知道、任何进程操作数据都不能在磁盘中进行的、要在内存中进行的、向用户返回也是在内存中。
3、缓冲区管理器:是将磁盘中管理的数据缓存在内存中的、通常而言、内存都是小于磁盘的、内存空间可能是不够我们的数据使用的、哪些数据需要清理、哪些数据需要写入磁盘中去、这些都是缓冲区所要完成的工作。
4、存取方法接口:当我们从缓冲区中读数据、写数据、就得用到这个存取方法接口。
5、事务:所谓事务、就是一个事情一次或多次操作的组合、而一个事务的管理系统有可能支持事务、也可能不支持事务、所谓支持事务、就是他能够把多个语句当做一个来管理、要么同时执行、要么同时不执行、如果一个关系型数据库支持事务、那一定要满足ACID(A:原子性C:一致性I:隔离性D:持久性)的测试。
随机I/O对我们的机械式磁盘来讲性能是非常差的、往磁盘里写数据、顺序I/O是最快的、所谓顺序I/O就是在磁盘中找一段连续的空间、当磁盘寻道完成以后、连续完成写操作、这就叫顺序I/O、那事务日志就是顺序I/O的一种表现、我们通过事务日志将用户存放的数据操作原封不动的直接写到事务日志中去、当你的事务完成了就立即写到磁盘上去、但放的不是磁盘数据文件中、而是放到一个叫事务日志的文件、叫事务日志。
在这个层面上、要完成事务的管理、就要有一个事务管理器了、其实早些年mysql不支持事务的、现在mysql的独特结构有些存储引擎支持了。
隔离:那如果一个用户往某个表中修改数据时、其他的用户是不能完成同一个表的操作的、那怎么保证你在修改的时候别人不能改呢、所以事务管理器在依赖于锁管理器、而对于锁来讲、还有一个叫粒度的概念、就要锁多大范围、比如操作一个用户修改表中的某条数据、只锁定用户修改的那条数据就可以了、其他的用户都可以修改其实的数据、而在早先时锁的时候是把整张表都锁起来的、粒度很粗糙、这就意味着并发性很低。
假如说我们的事务刚好写到日志中去、系统崩溃了、那数据只在日志中有、在数据文件中没有、数据没有那我们就认为这个数据是残缺的、因此在开机时必须经把数据同步到数据文件中去、而这个过程就叫恢数据复的过程、所以就要有一个恢复管理器了。
用户完成数据库操作靠的是sql(Struct Query Language结构化查询语言)语句、这是一种编程语言、也是一个编程接口、或者说是一个命令接口、他定义了我们数据能够接受一些类别的操作(DCL[Data Contorl Language 数据控制语言]\DDL[Data Defination Language 数据定义语言]\DML[Data Manipulation Language 数据操作语言])、而DDL就是用来创建表、索引等基本关系型数据库的语句、如CREATE/ALTER/DROP、DML数据操作语言则是增删查改这类的语句INSERT/DELETE/SELECT/UPDATE、DCL数据控制语言则实现创建用户、授权和权限收回的、/GRANT/REVOKE、以上的这些统统都是SQL的查询引擎。
当这些语句写入SQL时、需要有一个分析器来分析这些语句哪些是命令、哪些是参数、那分析完了之后就要执行了、那如果一个表中有多个索引、怎么知道用哪个索引查询效率最高、性能性优呢、这就要计划一下了、得把所有可用的查询计划都查询出来、用查询计划器来完成这个步骤、计划结束之后从中选择一个开销最小的、然而开销最小的也未必是最好的、那我们就得做一下优化了、就得用到一个优化器了、还有一个叫求解器、查询的结果的。
当用户并发多用户请求时、mysql怎么响应呢、mysql是单进程响应多用户请求的、内部是靠线程来实现的、每一个用户连接用一个线程来响应、他是单进程多线程模型的、当然、他的线程也是有上限的、mysql内部有一个叫线程池的概念、一个池子里能装的水是固定的了、那一个mysql的线程也是固定的、就要看你这个池的容量了、当你定义好这个线程池的大小时、就意味着你能够接受多少个用户并发的数量了、当然、这个池子的大小取决于系统资源的大小了、可以把他理解为中间键、是对连接管理的组件。
ODBC(Open DataBase Connectivity):开放数据库互联、这种组件是一种通用的非常底层的连接库、这种库使得你使用任何语言连接任何一种关系型数据库都能够通用。
32位的系统、32位的程序最大内存寻址能力是4G、但内核还要用去1G、因此单进程最大只能运行3G、对于mysql来说最多只能使用2.7G的内存、Intel公司早期的CPU产品的地址总线和地址寄存器的宽度为20位,即CPU的寻址能力为220=1048576字节=1M字节;286的地址总线和地址寄存器的宽度为24位,CPU的寻址能力为224=16M字节;386及386以上的地址总线和地址寄存器的宽度为32位,CPU的寻址能力为232=4096M字节=4G字节。
在计算机内部数据在数据总线上传递的,每条传输线我们称之为1位,各个传输线按序排列,他们之间是并行关系,地址总线也是一样的,数据总线决定每次传输数据的大小,地址总线决定了cpu所能访问的最大内存空间的大小,控制总线反映了数据的状态和传输方式,它是地址总线的扩展和补充。
P-php
一、PHP简介
PHP是通用服务器端脚本编程语言,其主要用于web开发以实现动态web页面,它也是最早实现将脚本嵌入HTML源码文档中的服务器端脚本语言之一。同时,php还提供了一个命令行接口,因此,其也可以在大多数系统上作为一个独立的shell来使用。
Rasmus Lerdorf于1994年开始开发PHP,起初他是一组被Rasmus Lerdorf称作个人主页工具(Personal Home Page Tool) 的Perl脚本, 这些脚本可以用于显示作者的简历并记录用户对其网站的访问。后来,Rasmus Lerdorf使用C语言将这些Perl脚本重写为CGI程序,还为其增加了运行Web forms的能力以及与数据库交互的特性,并将其重命名为个人主页面表单解析器(Personal Home Page/Forms Interpreter)或"PHP/FI"。此时,PHP/FI已经可以用于开发简单的动态web程序了,这即是PHP 1.0。1995年6月,Rasmus Lerdorf把它的PHP发布于comp.infosystems.www.authoring.cgi Usenet讨论组,从此PHP以开源的方式开始走进人们的视野并走进人们的生活。1997年,其2.0版本发布。
1997年,两名以色列程序员Zeev Suraski和Andi Gutmans重写的PHP的分析器(parser)成为PHP发展到3.0的基础,而且从此将PHP重命名为PHP: Hypertext Preprocessor。叫起文本预处理器。此后,这两名程序员开始重写整个PHP核心,并于1999年发布了Zend Engine 1.0,这也意味着PHP 4.0的诞生。2004年7月,Zend Engine 2.0发布,由此也将PHP带入了PHP5时代。PHP5包含了许多重要的新特性,如增强的面向对象编程的支持、支持PDO(PHP Data Objects)扩展机制以及一系列对PHP性能的改进。所以PHP到5.0才算真正成熟起来、并且流行来。
二、PHP Zend Engine (PHP的引擎)
Zend Engine是开源的、PHP脚本语言的解释器,它最早是由以色列理工学院(Technion)的学生Andi Gutmans和Zeev Suraski所开发,Zend也正是此二人名字的合称。后来两人联合创立了Zend Technologies公司。
Zend Engine 1.0于1999年随PHP 4发布,由C语言开发且经过高度优化,并能够做为PHP的后端模块使用。Zend Engine为PHP提供了内存和资源管理的功能以及其它的一些标准服务,其高性能、可靠性和可扩展性在促进PHP成为一种流行的语言方面发挥了重要作用。
Zend Engine的出现将PHP代码的处理过程分成了两个阶段:首先是分析PHP代码、把他做词法分析、语法分析、语义分析等等并将其转换为称作Zend opcode的二进制格式(类似Java的字节码),虽然是个解析器、中间多了一个步骤就是编译、他是个解析器、但能够实现运行时编译、先编译再执行、他编译的不一是个二进制程序、而是字节码程序。并将其存储于内存中;第二阶段是使用Zend Engine去执行这些转换后的Opcode。
三、PHP的操作码Opcode
Opcode是一种PHP脚本编译后的中间语言,就像Java的ByteCode,或者.NET的MSL。PHP执行PHP脚本代码一般会经过如下4个步骤(确切的来说,应该是PHP的语言引擎Zend):
1、Scanning(Lexing) —— 扫描 将PHP代码转换为语言片段(Tokens)
2、Parsing —— 分析 将Tokens转换成简单而有意义的表达式
3、Compilation —— 编译 将表达式编译成Opocdes
4、Execution —— 执行 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能
四、php的加速器
基于PHP的特殊扩展机制如opcode缓存扩展也可以将opcode缓存于php的共享内存中,从而可以让同一段代码的后续重复执行时跳过编译阶段以提高性能。由此也可以看出,这些加速器并非真正提高了opcode的运行速度,而仅是通过分析opcode后并将它们重新排列以达到快速执行的目的。
常见的加速器有:
APC(Alternative PHP Cahce)
eAccekerator
XCache
Zend Optimizer、Zend Guard Loader
NuSphere PhpExpress
PHP-5.3.3以上的版本才支持基于fastCGI运行于独立主机上的版本
五、PHP源码目录结构
PHP的源码在结构上非常清晰。其代码根目录中主要包含了一些说明文件以及设计方案,并提供了如下子目录:
1、build —— 顾名思义,这里主要放置一些跟源码编译相关的文件,比如开始构建之前的buildconf脚本及一些检查环境的脚本等。
2、ext —— 官方的扩展目录,包括了绝大多数PHP的函数的定义和实现,如array系列,pdo系列,spl系列等函数的实现。 个人开发的扩展在测试时也可以放到这个目录,以方便测试等。
3、main —— 这里存放的就是PHP最为核心的文件了,是实现PHP的基础设施,这里和Zend引擎不一样,Zend引擎主要实现语言最核心的语言运行环境。
4、Zend —— Zend引擎的实现目录,比如脚本的词法语法解析,opcode的执行以及扩展机制的实现等等。
5、pear —— PHP 扩展与应用仓库,包含PEAR的核心文件。
6、sapi —— 包含了各种服务器抽象层的代码,例如apache的mod_php,cgi,fastcgi以及fpm等等接口。
7、TSRM —— PHP的线程安全是构建在TSRM库之上的,PHP实现中常见的*G宏通常是对TSRM的封装,TSRM(Thread Safe Resource Manager)线程安全资源管理器。
8、tests —— PHP的测试脚本集合,包含PHP各项功能的测试文件。
9、win32 —— 这个目录主要包括Windows平台相关的一些实现,比如sokcet的实现在Windows下和*Nix平台就不太一样,同时也包括了Windows下编译PHP相关的脚本。
A,M,P是怎么联动起来工作的呢:
php这个解析器本身不跟任何任务器数据库打交道、需要打交道的是使用相关语言开发的应用程序、我们在应用程序中如果说实现了数据操作、如果说通过mysql来读取或存储数据的话才有可以用到mysql、否则是用不着的、所在并非有php就一定用到mysql。
apache + php结合的方式大概几种:
第一种:把php编译时直接编译成apache的模块、module模块化的方式进行工作。
第二种:CGI、通用网关接口、apache基于CGI跟hph通信
第三种:fastcgi、他也是一种协议、在这种模块下他们两个是怎么结合的
本来php是做为一个模块或都是php解析器运行的、不是监听在某个套接字上接收别人的请求的、而是让别人调用为一个进程使用的、可能是做为别人的子进程在运行、但是工作在fastcgi这种模块下的hph自行启用为一个服务进程、他监听在某个套接字上、随时可以接受来自客户端的请求的、他也是有一个主进程的、为了可以响应多个用户的请求、他会启用多个子进程、这些子进程我们也可以称为工作进程、他也是有空闲进程的、一但有客户请求他马上使用空闲的进程响应客户端的请求、将结果返回给前端的调用者、在php5.3.3版本之前他是没有这个能力了、只能工作在模块和CGI的方式下、而在5.3.3之后这个模块直接被收进php模块中、这种模块就叫php-fpm。
所以在以后编译php时、要想跟apache结合、就要编译成php-fpm、这是基于fastcgi工作的模式、并启动这服务进程、也就意味着他是通过套接字跟前端的调用者通信、既然基于套按字通信了、那么前端的web服务器和后面的php服务器完全可以工作在不同的主机上、实现了所谓的分层机制。
apache不会跟数据库打交道、他是个静态web服务器、跟数据库打交道的是应用程序、作为应用程序的源驱动能够基于某个API跟服务器之间建立会话、而后他会通过我们的mysql语句发送给数据库、数据库再将结果返回给应用程序、不是php进程、而是php进程中所执行的代码。
PHP跟mysql怎么整合起来呢、php又怎么被httpd所调用呢
首先httpd并不具备解析代码的能力、他要依赖于php的解析器、接着php本身不依赖于mysql、他只是一个解析器、能执行代码就OK了、那他什么时候用到mysql呢、如果要在mysql中存数据时才用到mysql、只是当php中有运行mysql语句时才用到mysql。
php语言要想联系mysql、通常用到php的驱动、rpm包的叫php_mysql、php跟mysql没有一点关系、只有程序员在php中编写mysql语句时才连接mysql来执行sql语句的。
基于php-mysql去连接mysql只使用一个函数mysql_connect();而mysql_connect()正是php-mysql提供的一个API、只要指明要连接的服务器即可。
结束:
以上都是LAMP的一些原理以及基础、都是文字说明、很是枯燥无味、但我还是觉得整理出来并记录下来会好点、等以后翻阅也方便点、下篇我们将来说说怎么实现LAMP分主机联动起来工作、LAMP也可以不分主机、可以放在同一台主机上也是可以工作的、这个完全没有问题、不过当业务繁忙时一台主机服务器恐怕是扛不住、所以要分主机实现。