Web服務器的主要功能是存儲,處理和傳遞網頁給客戶??蛻舳撕头掌髦g的通信使用超文本傳輸協議(HTTP)進行。交付的頁面最常見的是HTML文檔,除了文本內容之外,還可能包含圖像,樣式表和腳本。
一個用戶代理,通常是web瀏覽器或web爬蟲,通過發起一個HTTP請求以獲取服務器資源,服務器根據請求返回該資源或由于某種原因響應錯誤消息。該資源通常是服務器輔助存儲上的真實文件,但這不一定是這種情況,取決于Web服務器的實現方式。
雖然主要功能是提供內容,但HTTP的完整實現還包括從客戶端接收內容的方式。此功能用于提交Web表單,包括上傳文件。許多通用Web服務器還支持使用Active Server Pages(ASP),PHP或其他腳本語言的服務器端腳本。這意味著Web服務器的行為可以在單獨的文件中腳本化,而實際的服務器軟件保持不變。通常,此函數用于動態生成HTML文檔(“即時”),而不是返回靜態文檔。前者主要用于從數據庫檢索或修改信息。后者通??斓枚?,并且更容易被緩存,但不能提供動態內容。
Web服務器不僅用于為萬維網服務。它們也可以被嵌入到諸如打印機,路由器,網絡攝像機等設備中,并且僅服務于本地網絡。然后,web服務器可以用作用于監視或管理所討論的設備的系統的一部分。這通常意味著客戶端計算機上不需要安裝其他軟件,因為只需要一個網絡瀏覽器(現在大多數操作系統都包含在內)。
HTTP協議基于TCP協議上,是一個應用層協議,用于用戶代理和Web服務器進行通信。Web服務器通常采用一問一答的方式進行工作:
1、在用戶代理上用戶發起資源請求,請求內容包括但不限于:指定資源的較早標識IRI,指明動作類型(GET/POST/delete/PUT...)
2、用戶代理解析用戶輸入IRI并從中獲取目標域名,交由DNS服務器解析。如果IRI中指定某IP地址,這無需這步。
3、如果與服務器的會話還沒建立,此時先建立TCP連接,并完成HTTP協商(確定雙方均可接受的處理方式,包括協議版本,是否加密,內容格式等等)。
4、用戶代理把請求內容封裝成HTTP數據包向服務器發送。
5、服務器接收到資源請求并以之前協商好的方式解包并處理。
6、服務器請求的資源封裝成HTTP數據包并返回給用戶代理。
接下來重點說說服務器端的工作原理
TCP**模塊
服務器**某個端口(一般默認是8080端口,用戶可以設置其他端口),以建立和用戶代理之間的連接。一旦建立連接,用戶代理的后續HTTP請求將不用再進入**模塊。
預處理
此處主要做三件事:1. 從TCP報文中獲取HTTP請求報文。 2. 根據和用戶代理的協商進行解密,解壓,安全處理等等。3. 根據服務器自身的配置進行安全處理,建立會話狀態等等。
UR路由
解析URL字符串和動作以確定用戶代理請求的資源,根據匹配規則(通常根據正則表達式+后綴)路由到靜態資源處理模塊或動態資源處理模塊。
靜態資源處理模塊
負責找到靜態資源,比如HTML/Java/CSS文件/圖片/圖像,確定內容是字符流或者字節流,并確定對應MIME,比如HTML生成MIME為text/html的字符流,mpeg視頻文件生成MIME為video/mpeg的字節流。
動態資源處理模塊
運行業務邏輯處理,動態決定返回的資源內容和類型,內容和類型的處理原則同上。
后處理
根據和用戶協商的協議進行加密,壓縮,安全處理等等。
資源輸出模塊
把處理好的內容和類型封裝成HTTP報文,往TCP連接另一頭的用戶代理發送TCP報文(內容是HTTP報文)。
主流Web服務器
包括Apache、IIS 、Nginx,還有比較多使用Tomcat,Jetty,WebSphere,WebLogic,Kerstrel等等。
1.2.1. Web應用程序容器的由來
Web服務器的出現的標志著WWW時代的帶來,世界變得更加平面化。當初嘗到甜頭的開創者們開始不滿足與在互聯網上獲取靜態資源,于是出現了CGI腳本來動態獲取資源。再后來網絡發展方向也是朝著增強Web服務器動態獲取資源的能力前進。
以下是代表性的動態技術:技術名詞特點 CGI(Common Gateway Interface,公用***接口)以獨立進程運行,可以用多種語言開發,比如C,C++,VB,Perl,靈活但效率低,維護復雜 PHP服務器端嵌入HTML腳本,開源,功能強大,擴展性較差 JSP服務器端嵌入HTML腳本,跨平臺,部署前需編譯,主要缺點是編寫JSP比較復雜,需熟悉JAVA及相關技術 ASP服務器端嵌入HTML腳本,開發簡單,功能強大,只能在windows下運行 。
隨后Web服務器朝著企業級應用方向發展,快速的業務變化,迫使Web開發人員面對新的挑戰:如何快速寫出魯棒,可靠,符合業務需求的程序并順利部署?解決這個挑戰的一個有效的辦法是,創造一個Web程序開發框架(含運行環境,比如解釋執行JSP,Web API),這個框架解決魯棒性,可靠性問題,提供快速開發接口。換言之,開發人員只需要專注于實現業務本身,如有更高的需求還可以對框架進行定制和擴展。這個框架的另外一個名字是Web應用程序容器。
1.2.2. Web應用程序容器的基本工作原理
一般情況下Web應用程序容器是以下構成體系:
注:淺藍色的模塊是實現業務程序的主要使用模塊。
相對于Web服務器,該容器新增或強化了以下模塊:
分配線程池資源
容器為每個請求分配一個線程進行處理,通常采取線程池的方式高效理由CPU算資源。
封裝Request上下文
一個請求對應一個Request上下文,它主要封裝了用戶請求的主要構成:URL,HTTP請求頭,以及基于請求頭構建的Session,Cookie等對象,方便編程使用。
封裝Response上下文
一個請求對應一個Response上下文,主要用于向用戶代理返回資源??梢栽谄渲袑懭胼敵隽?,或者重定向,或者返回錯誤碼等等。
URL路由
在容器里,運行開發人員設置不同的路由匹配規則,比如讓.HTM返回.HTML,也可以自定義.xyz返回.HTML資源。更加靈活的配置可以參考JAVA MVC或者ASP.NET MVC的配置方案。
動態資源處理模塊
通常在這里具體的容器和開發語言都有自己的高效開發模型,比如JAVA的Servlet,ASP.NET的Web Form,MVC。
回收資源
這里會回收剛才的線程資源,為了線程復用,除非服務器空閑一般會將線程返回線程池。
可以看出,Web容器本身具備了做為一個Web服務器的功能,事實上通常實現Web容器功能的服務器就是一個Web服務器.比如Tomcat , IIS ,Jetty。
主流Web容器
包括Tomcat , IIS ,Jetty 。
還有比較多使用WebSphere,WebLogic等等。
在Web服務器發展的同一個時期,應用服務器已經存在并發展很長一段時間了。一些公司為Unix開發了Tuxedo(面向事務的中間件)、TopEnd、Encina等產品,這些產品都是從類似IMS和CICS的主機應用管理和監控環境衍生而來的。大部分的這些產品都指定了“封閉的”產品專用通信協議來互連胖客戶機(“fat” client)和服務器。在90年代,這些傳統的應用服務器產品開始嵌入HTTP通信功能,剛開始要利用***來實現。不久后它們之間的界線開始變得模糊了。
同時,web服務器越來越成熟,可以處理更高的負載、更多的并發和擁有更好的特性;應用服務器開始添加越來越多的基于HTTP的通信功能。所有的這些導致了web服務器與應用服務器的界線變得更窄了。
目前,“應用服務器”和“web服務器”之間的界線已經變得模糊不清了。但是人們還把這兩個術語區分開來,作為強調使用。
當有人說到“web服務器”時,你通常要把它認為是以HTTP為核心、web UI為向導的應用。當有人說到“應用服務器”時,你可能想到“高負載、企業級特性、事務和隊列、多通道通信(HTTP和更多的協議)”。但現在提供這些需求的基本上都是同一個產品。
下圖描述一個典型的Web應用服務器的結構圖:
從上圖中可以看到Web應用服務器包括了Web容器,同時內置了支撐企業應用的事務,安全,集成,通信,高可用等等功能,極大了減少了重復開發量,保障了業務系統快速開發和部署,而它本身也是一個Web服務器。Web應用服務器可以選擇使用大廠的WebLogic和WebSphere這種重量級產品外,也可以使用類似與Tomcat、jetty這樣的web containner 再加上第三方的框架(spring,hibernate等)來構建自己的Application Server;.NET Core平臺下可以選擇IIS, Apache,Nginx 與ASP.NET Core構建。
1.4. 反向代理概念與基本原理1.4.1. 反向代理基本概念
反向代理是代理服務器的一種。它根據客戶端的請求,從后端的服務器(如Web服務器)上獲取資源,然后再將這些資源返回給客戶端。與前向代理不同,前向代理作為一個媒介將互聯網上獲取的資源返回給相關聯的客戶端,而反向代理是在服務器端(如Web服務器)作為代理使用,而不是客戶端??蛻舳送ㄟ^前向代理可以訪問很多不同的資源,而反向代理是很多客戶端都通過它訪問不同后端服務器上的資源,而不需要知道這些后端服務器的存在,而以為所有資源都來自于這個反向代理服務器。
互聯網中的請求發送給反向代理,反向代理把請求轉發到內網中的服務器。
反向代理的主要作用為:
加密和ssl加速
負載均衡
緩存靜態內容
壓縮
減速上傳
安全防火墻
外網發布
突破互聯網封鎖
解決跨域問題
1.4.2. 反向代理基本工作原理
一個反向代理服務器的構成和處理過程如下圖:
左邊淡黃色功能模塊對外網報文進行處理,右邊灰色功能模塊針對內網報文進行處理
TCP**模塊
**TCP請求,這里的請求是指報文內容是某應用層協議(比如HTTP,FTP,EMAIL等應用層協議)的請求。至于這里是否會單獨產生一個線程來開始處理,這個由服務器自己決定,目前最流行的是先入消息隊列然后異步處理,這樣能極大提高代理的吞吐量和穩定性。
匹配被代理服務器
代理服務器根據一個表(存放外網url和內網服務器的對應關系,通常需人工進行設置),如果匹配到則繼續處理,否則依據外網協議返回錯誤信息,比如HTTP協議這返回404。
應用負載均衡策略
如果比較大型的互聯網應用,為了整體系統穩定性,解決單點問題,需要根據自定義策略合理的轉發報文給被代理服務器。簡單的策略是哈希分發或者隨機分發,一般可以由用戶進行配置和選擇。
預處理
這里依據協商好的外網應用協議進行解密,安全,會話,解壓等處理。
新生成網絡報文
這里依據協商好的內網應用協議生成網絡報文,這里可能會進行加密,安全,會話,壓縮等處理。
轉發給被代理服務器
把新生成的網絡報文發送給內網服務器(可能是否Web服務器,Ftp服務器,郵件服務器)。
接受網絡報文
接受內網服務器反饋的網絡報文。
預處理
這里依據協商好的外網應用協議進行加密,安全,會話,壓縮等處理。
資源輸出模塊
這時生成滿足外網應用協議要求的報文,并發送到外網連接的另一端(用戶代理)。
常用的反向代理服務器
它們的名字您一定記得:Ngnix,IIS,Apache。
從概念上講:Web服務器是提供WWW服務的程序;Web容器是提供給開發者的框架;Web應用程序服務器內容豐富得多,既可用各廠商通常遵循一定的工業標準并自定義擴展功能而成,也可以利用開源組件輕量級拼裝打造;反向代理服務器在企業級應用中表現突出,具有解決集中式安全,負載均衡等等優點。
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
這是陽光明媚的一天,互聯網里風平浪靜,一切都是欣欣向榮。我就是在這樣一個平凡的日子里誕生了。我給自己起了個名字叫超,不過我的師哥師姐們都喜歡叫我小超。從出生的那...
網上關于SEO優化的知識很多也很雜,很多新手都不知道如何選擇。本來耗子網站里每篇文章都有的詳細步驟的,考慮到很雜,于是耗子對各種SEO優化基礎知識進行了整理,但...
今天,我給大家講講如何利用電影貼吧引流輕松變現。這個很適合新手。廢話不多說,直接上干貨。每上映一個新片子,只要這個片子有一定的熱度,馬上該片子的貼吧就會出現各種...
搜索引擎優化(SEO)是指通過各種技術手段來提高網站在搜索引擎中的排名,從而增加流量,提升用戶體驗。優化關鍵詞是SEO的重要內容之一,通過選取熱門的關鍵詞并在網站中合理應用,能夠大幅提高網站在搜索引擎中的曝光率和排名。以下是百度SEO中6個關鍵詞優化技巧:1、選擇適合的關鍵詞:對于每個網站來說,適合的關鍵詞可能不同。要根據網站的主題和內容來選擇適合的關鍵詞。2、密度控制:關鍵詞出現的次數應該適當,...
網站的關鍵詞布局是影響網站排名和流量的重要因素之一。良好的關鍵詞布局策略不僅可以讓網站更容易被搜索引擎收錄和檢索,還可以提高用戶的訪問量和轉化率。本文將詳細介紹關鍵詞布局策略的各種技巧和方法,幫助網站優化自身的排名和流量。合理選取關鍵詞關鍵詞是用戶在搜索引擎上輸入的查詢詞匯。為了讓用戶能夠在搜索引擎上更容易地找到我們的網站,我們需要選擇相關性強、競爭度低、搜索量大的關鍵詞。這樣不僅可以提高網站被搜...
隨著互聯網的不斷發展,越來越多的企業開始重視網站SEO(SearchEngineOptimization)優化,以期提高網站在搜索引擎中的排名,從而吸引更多的流量和客戶。網站關鍵詞排名技術就是SEO優化中最關鍵的一環,本文將介紹關鍵詞排名的幾種技術和網站排名優化的方法。關鍵詞排名的4個技術1.關鍵詞選擇技術:根據用戶的搜索習慣和需求,選擇有競爭力、流量大、與業務相關的關鍵詞進行優化。2.網站結構優...