由浅入深学习Apache httpd原理与配置

2021-03-02 20:26

阅读:547

标签:magic   custom   check   secure   火墙   sock   过程   文件系统   grant   

一、apache简介

    Apache HTTPD又可以简称为httpd或者Apache,它是Internet使用最广泛的web服务器之一,使用Apache提供的web服务器是由守护进程httpd,通过http协议进行文本传输,默认使用80端口的明文传输方式,当然,后来,为了保证数据的安全和可靠性,又添加了443的加密传输的方式,Apache提供的服务器又被称为:补丁服务器,原因很简单,它是一款高度模块化的软件,想要给它添加相应的功能只需添加相应的模块,让其Apache主程序加载相应的模块,不需要的模块也可以不用加载,保证了Apache的简洁,轻便,高效性,当出现大量访问一个服务器是可以使用多种复用模式,保证了服务器能快速回应客户端的请求,如MPM,端口复用技术。

二、一次完整的http请求

1. http请求和响应过程:

(1)建立连接:客户端向服务器建立连接,发送报文,包含相应的请求资源的方法和客户端能支持的协议,编码等数据。

(2)服务器决定是否接受请求。

(3)如果服务器同意建立连接时便要处理请求,其中包括访问资源,访问资源时需要相应的映射机制,把客户端的URL转化为本地目录下相应的文件

(4)服务器访问到相应的资源后构建响应报文

(5)发送响应报文,报文中包含相应的状态码,和数据报文

(6)服务器记录日志

(7)客户端接收数据

附示例:

[root@177cnode1 ~]# telnet vhost2.jack.com 80
Trying 192.168.20.128...
Connected to vhost2.jack.com.
Escape character is ‘^]‘.
GET /index.html http/1.1  ====>使用GET方法请求服务器端的主页
host:192.168.20.128 ===>host字段不能缺少,但可以是空值,指定服务器的ip地址或域名也可以指定
端口号,请求报文以一个空行结尾,最后键入回车(两次回车)一般浏览器发送请求时会包括能接受的
编码方式,报文长度等
 
HTTP/1.1 200 OK   ===>回应报文的状态码
Date: Tue, 04 Oct 2016 03:48:47 GMT   ===>回应报文的其它字段
Server: Apache/2.4.6 (CentOS)
Last-Modified: Sun, 02 Oct 2016 08:41:47 GMT
ETag: "16-53dddcc3d4d35"
Accept-Ranges: bytes
Content-Length: 22
Content-Type: text/html; charset=UTF-8
 
this is vhost2‘s page    ===>网页内容
[root@177cnode1 ~]#
 

2. http两种连接方式:

(1)短连接:非保持连接

(2)长连接:保持连接。

数量限制:多少个资源

时间限制:最长可以保持长连接多长时间

附示例:

  在相应的目录下面建立以.conf结尾的文件内容如下keepalive.conf文件

[root@177cnode1 conf.d]# pwd
/etc/httpd/conf.d
[root@177cnode1 conf.d]# cat keepalive.conf 
keepalive on
keepalivetimeout 180 
MaxKeepAliveRequests 1000
 

   上面配置中第一行启用了keepalive 功能,第二行设置建立连接后多少秒后断开连接,第三项设置了最大保持alive状态的请求数量为1000个

3.  多种服务器状态码:

  在服务器回应客户端时会回应相应的状态码,不同的状态码具有不同的含义

1xx:信息类

2xx:成功类

3xx:重定向类

4xx:客户端错误类

5xx:服务端错误类

4. 多种客户端请求方法:

GET、HEAD、POST、PUT、DELETE、OPTION、TRACE …

附:IANA机构对socket端口分配:

1-1024:众所周知端口,永久分配给固定的应用程序使用,属于特权端口,只有root有权使用

1024-4195:注册端口,要求略宽松,分配给某程序注册使用

41952-65535:客户端程序使用的随机端口,动态端口,又叫私有端口或随机端口

三、http的特性:

高度模块化:core module +modules

1. 多路处理模块MPM:multipath processing modules

MPM模块在httpd-2.4中是动态共享模块的,没有编译如主程序当中,httpd-2. 2中是静态编译入主程序当中的。在这些模型中,默认使用第一个prefork模型,第二个模型因为出错不以排查,因此使用较少,在第三个模型当中因为是比较新的功能,只有在httpd-2.4之后的版本才有的功能,所以使用较少,因为在企业使用时稳定才是王道,绝非功能越新越好

 

prefork:多进程模型,也是默认类型,采用预派生子进程方式,用单独的子进程来处理不同的请求,进程之间彼此独立。两级架构,主进程一个子进程若干个。

 

几个常用选项(指令后面的#代表相应数量的数字):

这些选项直接在主配置文件中修改(httpd-2.2,包含2.2之前),在httpd-2.4之后的版本中mpm的配置文件(/etc/httpd/conf.modules/00-mpm.conf)中编写即可

ServerLimit # 服务器允许配置的进程数上限,在其它两种模型中因为是多级架构,所以和线程子进程的乘积等有关系

StartServers #  httpd服务在启动时要启动的子进程数量

MinspareServers # 在服务器启动StartsServer指定的子进程书量后每隔一秒创建一定数量的进程(是指数型的增加,第一次1个,第二次两个,第三次4个,一直增加到32个每秒后稳定增加),直到增加到MinSpareServer指定的数量

MaxSpareServers # 这个值是设置系统最大空闲进程数量,每当大于这个数量的值时,系统会kill掉一部分子进程,但是当这个值设置的小于MinSpareServer的值时,系统会自动将该值设置为最小空闲进程数量加一

MaxConnectionsPerchild # 这个值代表每个子进程最大能处理多少个连接之后将被系统kill掉(因为进程在使用过程当中可能有数据错误或无法以外的内存泄露等)如果设置为0则代表永不kill,这个值从httpd-2.4之后才开始叫这个名字

MaxRequestWorkers #最大处理并发请求数量的限制2.4之后的版本才有的指令,意义等同于MaxClient

MaxClient # MaxClients设定的是 Apache可以并发处理的请求,是对Apache性能影响最大的参数。其缺省值150是远远不够的,如果请求总数已达到这个值(可通过ps -ef|grep http|wc -l来确认),那么后面的请求就要排队,直到某个已处理请求完毕。这就是系统资源还剩下很多而HTTP访问却很慢的主要原因。虽然理论上这个值越大,可以处理的请求就越多,但Apache默认的限制不能大于256。ServerLimit指令无须重编译Apache就可以加大MaxClients。这个指令是httpd-2.2的

 

worker:多线程模型,为每个请求分配一个线程,三级架构,一个主进程,若干子进程,每个子进程管理若干个线程

ServerLimit

StartServers

MinSpareThreads

MaxSpareThreads

MaxRequestWorkers 应该设置为0,因为此时它已经不在相应用户请求,0表示不加限制,不kill

        ThreadsPerChild

event:事件驱动模型,每个进程处理多个请求有多个进程

ThreadsPerChild

MaxRequestWorkers

        AsyncRequestWorkerFactor

3. httpd的功能特性:

虚拟主机

反向代理

负载均衡

CGI:common Gateway Interface

4. httpd的版本:

httpd-1.3

httpd-2.0

httpd-2.2

httpd-2.4

在centos6.8中系统版本为httpd-2.2,centos7.0之后的版本自带的httpd版本为httpd-2.4

四、程序环境:

1. 主程序:/usr/sbin/httpd

2. 通过正则表达式将注释行和空行去掉,下面是httpd-2.4版本配置文件示例:

[root@7cnode2 ~]# grep -v -E -e"^[[:space:]]*#" -e "^[[:space:]]*$" httpd.conf

在此需要注意的是该配置文件中每一配置分为两部分,配置指令和值两部分,配置指令不分区大小写,值部分除了路径名是要区分大小写,其它部分也是不区分大小写的!

ServerRoot "/etc/httpd"  配置httpd使用哪个位置中使用相对路径查找配置文件,如指定错误日志时写到的就是一个相对路径,相对与此处的目录查找错误日志文件存放目录

Listen 80  监听端口,可以同时监听多个端口不过要注意设置selinux和防火墙,可以重复定义多次,监听多个端口

Include conf.modules.d/*.conf 加载其它配置文件,类似于C语言的头文件的加载,此处可以使用相对路径也可以使用绝对路径,相对路径是相对于ServerRoot的路径,可以使用glob通配符,此处的配置文件是用来加载DSO(dynamic shared object)模块

User apache

Group apache 程序运行时的用户名和组名,在安装Apache时已经创建了系统账号和组账号,程序启动时是以root身份启动,执行完root特权的所有操作后(例如启动监听80端口,低于1024的端口的监听需要root才有权力执行)会以非特权用户执行程序

ServerAdmin root@localhost 管理员的邮箱地址,当httpd出问题时,联系该邮箱地址可以联系到管理员

ServerName www.jackcui.node2.com:80   ServerName给定了主机名和端口号,主要用于服务器辨识自己是什么名字,如果此处没有配置的话服务器会进行查询/etc/hosts文件,最后查询自己的DNS服务器直到将IP地址反解至主机名如果没有DNS服务器,此处也可以直接写自己的ip地址和端口号,强烈建议此处的配置不要省略,否者重启httpd服务时会很慢,因为会进行DNS反解析,这一个配置的作用主要是用来定义重定向时,服务器区分访问的域名是自己还是别的主机

  关于目录的一些配置,有关目录的访问权限等都是在这里定义,可以使用基于URL定义访问权限,但要使用

来定义

    AllowOverride none   AllowOverride参数就是指明Apache服务器是否去找.htacess文件作为配置文件,如果设置为none,那么服务器将忽略.htacess文件,如果设置为All,那么所有在.htaccess文件里有的指令都将被重写。对于AllowOverride,还可以对它指定如下一些能被重写的指令类型.

    Require all denied 对目录的授权此处为拒绝所有访问

DocumentRoot"/var/www/html"  定义目录的根位置类似于配置文件的根,不过此处是网页存放的根,在定义Directory目录时,那里的目录同样可以是绝对路径,也可以是相对于此处的路径

    AllowOverride None

    Require all granted

    Options Indexes FollowSymLinks

    AllowOverride None

    Require all granted

  此处为仅在加载了模块dir_module 后才执行,DirectoryIndex配置指令后面的值可以跟多个,先后顺序很关键,值的含义为URL访问时进入目录是应该寻找哪一个文件,多个时按顺序寻找,找不到第一个然后寻找第二个值

    DirectoryIndex index.html

  对所有安全相关的敏感文件设置为禁止,如目录下的.htaccess,.htpasswd

    Require all denied

ErrorLog"logs/error_log"  设置错误日志的存放路径,这里是一个软链接,指向/var/log/httpd/的符号链接

LogLevel warn  设置日志级别,仅达到该级别才记录日志

 

下面定义了多种日志的记录格式,可以人为的修改自己想要定义的格式,LogFormat后面的双引号具体定义了日志的格式,后面有一个名字,在使用该定义好的格式可以使用后面的别名代替,当然也可以在使用时直接用双引号加相应的格式,访问日志也可以在虚拟主机中单独定义

    LogFormat "%h %l %u %t\"%r\" %>s %b \"%{Referer}i\"\"%{User-Agent}i\"" combined

    LogFormat "%h %l %u %t\"%r\" %>s %b" common

   

      LogFormat "%h %l %u %t\"%r\" %>s %b \"%{Referer}i\"\"%{User-Agent}i\" %I %O" combinedio

   

下面定义问日志,和使用相应的格式为combined

    CustomLog "logs/access_log"combined

ScriptAlias和Alias类似都是在此定义,两者的区别是ScriptAlias是作为服务器的运行文件,而不是发送到客户端的文件

    ScriptAlias /cgi-bin/"/var/www/cgi-bin/"

    AllowOverride None

    Options None

    Require all granted

mime多媒体英特网邮件扩展,这个模块是用来指定内容元数据,选择HTTP响应的映射模式中的URI或文件的元数据值的内容。如mime-type中的类型有语言,字符集,编码方式

    TypesConfig /etc/mime.types

    AddType application/x-compress .Z

    AddType application/x-gzip .gz .tgz

    AddType text/html .shtml

    AddOutputFilter INCLUDES .shtml

下面的设置向text/plain和text/html 资源的content-type报头中添加charset部分。

AddDefaultCharset UTF-8

    MIMEMagicFile conf/magic

EnableSendfile on

IncludeOptionalconf.d/*.conf

 

 

3. httpd-2.2版本与httpd-2.4的差别:

    绝大部分基本是相同的,只不过后者更加趋向于模块化,将主配置文件分割,便于配置和管理下面将说一下具体的差别

(1)ServerTokens指令设置服务器HTTP响应头字段的值。在2.2的版本中有,为了保护服务器免收黑客的攻击,应把服务器回应的消息显示的最不详细为好。

(2)下面是ServerTokens的一些可能的赋值:
ServerTokens Prod 显示“Server: Apache”
ServerTokens Major 显示 “Server: Apache/2″
ServerTokens Minor 显示“Server: Apache/2.2″
ServerTokens Min 显示“Server: Apache/2.2.17″
ServerTokens OS 显示 “Server: Apache/2.2.17 (Unix)”
ServerTokens Full 显示 “Server: Apache/2.2.17 (Unix) PHP/5.3.5″

(3)PidFilerun/httpd.pid 保存httpd运行时的进程id,同样是在2.2版本中有

(4)Keepalive定义,2.2版本放在了主配置文件当中,2.4版本主配置文件没有定义,管理员可以自己定义一个单独配置文件

(5)prefork的模块定义,在2.2版本中可以直接编辑主配置文件定义prefork模块的相关参数,2.4版本的在专门的模块配置文件当中定义

 

4. 其它 配置文件:

  下面的三个文件分别是主配置文件和辅助配置文件,以及模块配置文件,对主配置文件进行分割方便管理,在重启服务或者重新加载配置文件时会一并加载

/etc/httpd/conf/httpd.conf 

/etc/httpd/conf.d/*.conf

/etc/httpd/conf.modules.d/*.conf

模块的加载格式为:

LoadModule  模块名  模块存放路径

UnitFile:/usr/lib/systemd/system/httpd.service   //Unit文件是rhel7之后的版本系统服务脚本启动文件

 模块文件目录:

/usr/lib64/httpd/modules/  

5. 站点主服务器根目录默认:/var/www/html

6. 日志文件:/var/log/httpd/

error_log 错误日志

access_log 访问日志

7. 判断服务正常与否:

ss -tnlp | grep “:80\>”

systemctl status httpd.service

五、三种虚拟主机的配置

1. 基于IP地址的虚拟主机:

   在同一台服务器上,有多个IP地址,每一个IP地址负责一台虚拟主机的绑定,每个主机的主机名不一样如www.vhost1.com  www.vhost2.com,使用较少,因为IP地址较为宝贵,而这种虚拟主机需要大量IP地址。

配置示例:

(1)  添加多个供虚拟主机使用的IP地址

[root@cnode6_8conf.d]# ip a |grep 192  //此时eth2有一个IP地址
    inet 192.168.66.142/24 scope global eth2
 

#使用ip命令添加三个临时IP地址

[root@cnode6_8conf.d]# ip addr add 192.168.66.143/24 dev eth2
[root@cnode6_8conf.d]# ip addr add 192.168.66.144/24 dev eth2
[root@cnode6_8conf.d]# ip addr add 192.168.66.145/24 dev eth2
 
[root@cnode6_8conf.d]# ip a | grep 192  //通过查看多了3个IP地址
    inet 192.168.66.142/24 scope global eth2
    inet 192.168.66.143/24 scope globalsecondary eth2
    inet 192.168.66.144/24 scope globalsecondary eth2
 

(2)添加虚拟主机的配置文件

[root@cnode6_8conf.d]# pwd
/etc/httpd/conf.d
[root@cnode6_8conf.d]# vim virtual.conf
> 
    ServerName www.vhost1.com
    DocumentRoot "/testdir/vhost1"
    "/testdir/vhost1">
             AllowOverride none
             Allow from all
             Order Allow,deny   
    >   
>
 
>
    ServerName www.vhost2.com
    DocumentRoot "/testdir/vhost2"
    "/testdir/vhost2">
             AllowOverride none
             Allow from all
             Order Allow,deny   
    >   
>
 

 

(3)修改/etc/hosts文件(此处不是必须的,因为这里没有DNS服务器解析域名,只好修改hosts文件以供测试!)

[root@cnode6_8conf.d]# grep "^192" /etc/hosts
168.66.143  www.vhost1.com
168.66.144  www.vhost2.com
168.66.145 www.vhost3.com
 

(4)添加相应的目录和文件重启服务测试,添加的目录和文件都因该是配置文件定义的。这里省略这些步骤,测试结果应该为访问相应的域名,会被解析为相应的IP能访问到响应的网页

 

2. 基于域名的虚拟主机:

  在同一台服务器上面,仅有一个IP地址,使用不同的主机名访问不同的网页内容,在虚拟主机块定义上面需要使用NameVirtualHost声明监听的IP地址,使用较多。需要注意在httpd-2.4的版本中不需要使用NameVirtualHost关键字指定监听IP地址和端口号,其余部分没有变化

(1)修改配置文件

 

root@cnode6_8conf.d]# pwd
/etc/httpd/conf.d
[root@cnode6_8conf.d]# vim virtual.conf
NameVirtualHost 192.168.66.142:80 //如果要监听主机所有IP可以使用通配符 *
80>80>


评论


亲,登录后才可以留言!