全球资讯网

网络浏览器中显示的网页
全球资讯网
Robert Cailliau设计的历史悠久的万维网徽标
年开始1989
蒂姆·伯纳斯·李(Tim Berners-Lee)
组织库恩

万维网www或himst web )是一个信息系统,它可以通过用户友好的方式通过互联网共享内容,以吸引以外的用户和业余爱好者。它允许根据超文本传输​​协议(HTTP)的特定规则通过Internet访问文档和其他Web资源

该网络是由英国计算机科学家蒂姆·伯纳斯·李(Tim Berners-Lee)发明的,并于1989年在CERN上发明,并于1991年向公众开放。它被认为是“通用链接的信息系统”。文档和其他媒体内容可通过Web服务器提供给网络,可以通过Web浏览器等程序访问。通过称为统一资源定位器(URL)的字符串确定并找到了万维网上的服务器和资源。

原始且仍然非常常见的文档类型是用超文本标记语言(HTML)格式化的网页。此标记语言支持纯文本图像,嵌入式视频音频内容以及实现复杂用户交互的脚本(简短程序)。 HTML语言还支持超链接(嵌入式URL),可立即访问其他Web资源。 Web导航或网络冲浪是跨多个网站遵循此类超链接的常见做法。 Web应用程序是作为应用程序软件运行的网页。网络中的信息使用超文本传输​​协议(HTTP)在Internet上传输。具有共同主题的多个Web资源,通常是一个通用域名组成的网站。单个Web服务器可能会提供多个网站,而某些网站(尤其是最受欢迎的网站)可以由多个服务器提供。网站内容由无数公司,组织,政府机构和个人用户提供;并包括大量的教育,娱乐,商业和政府信息。

网络已成为世界上主要的信息系统平台。它是全球数十亿人用于与互联网互动的主要工具。

历史

Tim Berners-Lee爵士CERN上使用了下一部计算机,并成为了世界上第一款Web服务器

网络是由英国计算机科学家蒂姆·伯纳斯·李(Tim Berners-Lee)发明的,在CERN工作。他的动机是在大型且不断变化的组织中存储,更新和查找文档和数据文件以及将其分发给CERN以外的合作者的动机。 Berners-Lee在其设计中驳回了现​​有的CernDoc文档系统和Unix文件系统中使用的通用树结构方法,以及依赖用关键字标记文件的方法,如VAX/Notes System中。取而代之的是,他采用了他在CERN建造的私人询问系统(1980)中付诸实践的概念。当他意识到泰德·尼尔森(Ted Nelson)超文本模型(1950)时,可以通过与文本中嵌入的“热点”相关的超链接以不受约束的方式链接文档时,它有助于确认其概念的有效性。

该模型后来被AppleHypercard系统普及。与HyperCard不同,Berners-Lee的新系统从一开始就旨在支持独立计算机上多个数据库之间的链接,并允许许多用户从Internet上的任何计算机同时访问。他还指定,除了图形,语音和视频之类的文本外,该系统最终应处理其他媒体。链接可以参考可变数据文件,甚至可以在其服务器计算机上启动程序。他还构思了“网关”,该“网关”将允许通过新系统访问以其他方式组织(例如传统的计算机文件系统UUCP新闻)。最后,他坚持认为该系统应分散,而无需对链接的创建任何中央控制或协调。

伯纳斯·李(Berners-Lee)于1989年5月向CERN提交了一项建议,而没有给系统起名字。他在1990年底之前实施了一个工作系统,其中包括一个名为WorldWideWeb (成为项目和网络的名称)的浏览器和在CERN运行的HTTP服务器。作为该开发的一部分,他定义了HTTP协议的第一个版本,即基本URL语法,并隐式将HTML变成了主要文档格式。该技术从1991年1月开始于1991年1月,然后于1991年8月23日在整个互联网上发布到其他研究机构。网络在CERN取得了成功,并开始传播到其他科学和学术机构。在接下来的两年中,创建了50个网站

CERN于1993年免费提供了Web协议和代码,并实现了广泛使用。 NCSA当年晚些时候发布了Mosaic Web浏览器后,随着成千上万的网站在不到一年的时间内涌现,网络的受欢迎程度迅速增长。 Mosaic是一个图形浏览器,可以显示内线图像并提交由HTTPD服务器处理的表单马克·安德森(Marc Andreessen)吉姆·克拉克(Jim Clark)在第二年创立了Netscape ,并发布了Navigator浏览器,该浏览器将JavaJavascript引入了网络。它很快成为主要的浏览器。 Netscape于1995年成为一家上市公司,引发了网络的疯狂,并开始了互联网泡沫。微软的回应是开发了自己的浏览器Internet Explorer ,开始了浏览器战争。通过将其与Windows捆绑,它成为了14年的主要浏览器。

Berners-Lee创立了世界范围的Web财团(W3C),该联盟于1996年创建XML ,并建议用更严格的XHTML代替HTML。同时,开发人员开始利用一个名为XMLHTTPRequest的IE功能来制作Ajax应用程序,并启动了Web 2.0革命。 MozillaOpera和Apple拒绝了XHTML,并创建了开发HTML5的Whatwg 。 2009年,W3C承认并放弃了XHTML。在2019年,它将对HTML规范的控制权归结为Whatwg。

万维网一直是信息时代发展的核心,是数十亿人在互联网上进行互动的主要工具。

命名法

蒂姆·伯纳斯·李(Tim Berners-Lee)指出,万维网正式拼写为三个单独的单词,每个单词都大写,没有任何介入连字符。尽管如此,它通常被称为网络,通常也称为网络。有关详细信息,请参见Internet的大写。在普通话中,万维网通常是通过唱机语义匹配wànwéiwǎng万维网)的唱片,它满足了www ,字面意思是“ 10,000维网”,这种翻译反映了全球宽阔的设计概念和扩散网络。

www前缀的使用一直在下降,尤其是当Web应用程序寻求为其域名贴上标记并使其易于发音时。随着移动网络的流行, Gmail .com, outlook.commySpace .com, facebook .com和Twitter .com等服务最常在不添加“ www”的情况下提及。 (或者,确实是“ .com”)到域。

在英语中, www通常被读为Double-U Double-U Double-U 。一些用户将其发音为Dub-Dub-Dub ,尤其是在新西兰。斯蒂芬·弗莱(Stephen Fry)在他的“荚果”系列播客中,宣布它是wuh wuh wuh 。英国作家道格拉斯·亚当斯(Douglas Adams)曾经在周日的《独立报》 (1999年)中打趣道:“全球网络是我唯一知道的缩短形式要比缩短的时间要长三倍。”

功能

万维网作为应用程序层协议的功能,该协议是在“象征性地”上运行的Internet,有助于使其更具功能性。 Mosaic Web浏览器的出现有助于使网络更加有用,以显示图像和移动图像( GIF )。

互联网万维网术语经常被使用而没有太大区别。但是,这两个术语并不意味着同一件事。 Internet是通过电信和光学网络互连的计算机网络的全球系统。相比之下,万维网是由超链接和URI链接的全球文档和其他资源集合。使用HTTPHTTPS访问Web资源,这些http或HTTP是使用Internet的传输协议的应用程序级别的Internet协议。

通常,在万维网上查看网页通常是通过将页面的URL键入网络浏览器或按照超链接到该页面或资源的超链接来开始。然后,Web浏览器启动一系列背景通信消息,以获取并显示请求的页面。在1990年代,使用浏览器查看网页,并通过超链接从一个网页转移到另一个网页,将其称为“浏览”,“网络冲浪”(频道冲浪后)或“导航Web”。对这种新行为的早期研究调查了使用Web浏览器的用户模式。例如,一项研究发现了五种用户模式:探索性冲浪,窗户冲浪,进化的冲浪,有限的导航和目标导航。

下面的示例演示了Web浏览器在访问url http://example.org/home.html上的页面时的功能。浏览器使用全球分布式域名系统(DNS)将URL( example.org )的服务器名称(example.org)解析到Internet协议地址中。此查找返回一个IP地址,例如203.0.113.42001:DB8:2E :: 7334 。然后,浏览器通过将HTTP请求通过Internet发送到该地址的计算机来请求资源。它要求从特定的TCP端口编号提供服务,该服务以HTTP服务众所周知,以便接收主机可以将HTTP请求与其他网络协议区分开。 HTTP通常使用端口号80 ,对于HTTPS,它通常使用端口号443 。 HTTP请求的内容可以像两行文本一样简单:

GET /home.html HTTP/1.1
Host: example.org

接收HTTP请求的计算机将其传递给Web服务器软件收听端口80上的请求。如果网络服务器可以满足该请求,则它将将HTTP响应发送回浏览器,以表明成功:

HTTP/1.1 200 OK
Content-Type: text/html; charset=UTF-8

然后是请求页面的内容。基本网页的超文本标记语言( HTML )可能看起来像:

<html>
  <head>
    <title>Example.org – The World Wide Web</title>
  </head>
  <body>
    <p>The World Wide Web, abbreviated as WWW and commonly known ...</p>
  </body>
</html>

Web浏览器解析HTML并解释标记(<title>,<p>对于段落,围绕单词以格式化屏幕上的文本的单词。许多网页使用HTML来引用其他资源的URL,例如图像,其他嵌入式媒体,影响页面行为的脚本以及影响页面布局的级联样式表。浏览器向Web服务器提出了其他Internet媒体类型的HTTP请求。当它从Web服务器接收其内容时,浏览器将按照其HTML指定和这些附加资源逐渐呈现到屏幕上的页面。

html

超文本标记语言(HTML)是用于创建网页Web应用程序的标准标记语言。凭借级联样式的表(CSS)和JavaScript ,它构成了全球网络的基石技术。

Web浏览器Web服务器或本地存储接收HTML文档,并将文档渲染到多媒体网页中。 HTML在语义上和最初包括文档出现的线索中描述了网页的结构。

HTML元素是HTML页面的构件。使用HTML构造,图像和其他对象(例如交互式形式)可以嵌入到渲染页面中。 HTML通过表示标题,段落,列表,链接,引号和其他项目等文本的结构语义来创建结构化文档的方法。 HTML元素用标签描绘,使用角括号编写。标签,例如<img /><input />直接将内容引入页面。其他标签,例如<p>包围并提供有关文档文本的信息,并可能包括其他标签作为子元素。浏览器不显示HTML标签,而是使用它们来解释页面的内容。

HTML可以嵌入用脚本语言(例如JavaScript)编写的程序,这会影响网页的行为和内容。包含CSS定义了内容的外观和布局。自1997年以来,全球网络联盟(W3C)是HTML和CSS标准的维护者,它鼓励使用CSS而不是明确的介绍HTML。

链接

大多数网页都包含到其他相关页面的超链接,以及可能下载的文件,源文档,定义和其他Web资源。在基础HTML中,超链接看起来像这样:<a href="http://example.org/home.html">Example.org Homepage</a>.

www的微小分数的图形表示,展示了超链接

通过超文本链接互连的有用的相关资源集合被称为信息。互联网上的出版物在1990年11月创造了蒂姆·伯纳斯·李(Tim Berners-Lee)最初称为WorldwideWeb (随后被丢弃的原始骆驼)。

WebGraph描述了Web的超链接结构:Web图的节点对应于网页(或URL),它们之间的有向边缘到超链接之间。随着时间的流逝,许多由超链接指向的网络资源消失,重新安置或替换为不同的内容。这使得超链接过时,这是在某些圆圈中称为链接腐烂的现象,受其影响的超链接通常称为“死”链接。网络的短暂性质促使许多努力归档网站。自1996年以来活跃的互联网档案是在这种努力中最著名的。

www前缀

许多用于万维网的主机名始于www ,因为根据他们提供的服务命名互联网主机的长期做法。 Web服务器主机名通常是www ,就像FTP服务器可能是FTP ,以及USENET新闻服务器新闻NNTP一样。这些主机名显示为域名系统(DNS)或子域名,如www.example.com中。任何技术或政策标准都不需要使用www ,许多网站不使用它;第一台Web服务器是NXOC01.CERN.CH 。据与蒂姆·伯纳斯·李一起工作的帕洛·帕拉齐(Paolo Palazzi)的说法, www作为子域的流行用途是偶然的。全球网络项目页面旨在在www.cern.ch上发布,而info.cern.ch旨在作为CERN主页;但是,DNS记录从未被切换,并且随后复制了将www预备到机构网站域名的实践。许多建立的网站仍然使用前缀,或者用于特殊目的的其他子域名,例如www2Secureen 。设置了许多这样的Web服务器,以便主要域名(例如,example.com)和www subdomain(例如,www.example.com)请参阅同一站点;其他则需要一种或另一种表格,或者它们可能映射到不同的网站。通过创建指向一组Web服务器的CNAME记录,使用子域名名称可用于负载传入的Web流量。由于目前,只能在CNAME中使用一个子域,因此无法使用Bare域根无法实现相同的结果。

当用户在其地址栏输入字段中向Web浏览器提交不完整的域名时,某些Web浏览器会自动尝试将前缀“ www”添加到其开始和可能的“ .com”。 “最后,取决于可能缺少的内容。例如,输入“ Microsoft”可以转换为http://www.microsoft.com/和“ openoffice”到http://www.openoffice.org 。此功能开始出现在Firefox的早期版本中,当时它仍然在2003年初的工作标题“ Firebird”中出现,这是从较早的浏览器中的浏览器(例如Lynx)进行的。据报导,微软在2008年获得了同一想法的美国专利,但仅针对移动设备。

方案说明器

方案说明器http://https://在Web URI的开头,分别指HYPERTEXT传输协议或HTTP安全。他们指定用于请求和响应的通信协议。 HTTP协议对于万维网的操作至关重要,当浏览器发送或检索机密数据(例如密码或银行信息)时,HTTPS中添加的加密层至关重要。如果省略,Web浏览器通常会自动将http:// http:// http:// to用户输入。

页面

Wikimedia Commons主页的屏幕截图

网页(也作为网页编写)是适合万维网和网络浏览器的文档。 Web浏览器在监视器移动设备上显示网页。

术语网页通常是指可见的内容,但也可能是指计算机文件本身的内容,该文件通常是包含用HTML或可比标记语言编写的超文本文本文件。典型的网页提供了通过超链接浏览到其他网页的超文本,通常称为链接。在介绍每个网页时,Web浏览器通常必须访问多个Web资源元素,例如阅读样式表脚本和图像。

在网络上,Web浏览器可以从远程Web服务器检索网页。 Web服务器可能会限制对公司Intranet等专用网络的访问。 Web浏览器使用超文本传输​​协议(HTTP)向Web服务器提出此类请求。

与Web服务器文件系统中的Web内容一样,静态网页的交付方式完全与存储一样。相反,通常由服务器端软件驱动的Web应用程序生成动态网页。当每个用户可能需要完全不同的信息时,使用动态网页,例如银行网站,网络电子邮件等。

静态页面

Web应用程序生成的动态网页相比,静态网页有时称为平面页/固定页面)是一个完全与存储的用户交付的网页

因此,静态网页从所有上下文中显示了所有用户的相同信息,但要遵守Web服务器的现代功能,以协商该文档的内容类型或该语言的语言,并在该文档中提供此类版本,并且服务器已配置为这样做。

动态页面

动态网页:服务器端脚本示例( PHPMySQL

服务器端动态网页是一个网页,其构造由应用程序服务器处理服务器端脚本控制。在服务器端脚本中,参数确定每个新网页的组装如何进行,包括设置更多客户端处理。

客户端动态网页使用在浏览器中运行的JavaScript处理网页。 JavaScript程序可以通过文档对像模型或DOM与文档进行交互,以查询页面状态并更改它。然后,相同的客户端技术可以以相同的方式动态更新或更改DOM。

然后,用户或计算机程序重新加载了动态网页,以更改一些可变内容。更新信息可能来自服务器,也可以来自对该页面DOM进行的更改。这可能会或可能不会截断浏览历史记录或创建保存的版本要返回,但是使用Ajax Technologies的动态网页更新不会创建一个页面以返回到显示页面的Web浏览历史记录。最终用户使用AJAX技术,将一个动态页面管理为Web浏览器中的一个页面,而该页面上呈现的实际Web内容可能会有所不同。 AJAX引擎仅位于浏览器上,要求其dom, dom ,dom,其客户端的一部分。

动态HTML或DHTML是用于创建不是静态Web页面的Web页面的技术和方法的伞术语,尽管自从Ajax的普及以来,它已经不常用,该术语本身很少使用。客户端 - 摩擦,服务器端脚本或这些组合的组合使浏览器中的动态网络体验。

JavaScript是一种脚本语言,最初是由Brendan Eich (然后是Netscape)在1995年开发的,可用于网页。标准化版本是eCmascript 。为了使网页更加互动,一些Web应用程序还使用JavaScript技术,例如Ajax异步JavaScript和XML )。客户端脚本与该页面交付,可以根据用户操作(例如鼠标移动或单击)或基于经过的时间来向服务器提出其他HTTP请求。服务器的响应用于修改当前页面,而不是在每个响应中创建一个新页面,因此服务器只需提供有限的增量信息即可。可以同时处理多个AJAX请求,并且在检索数据时,用户可以与页面进行交互。网页还可以定期对服务器进行轮询以检查是否可用。

网站

usap.gov网站

网站是相关的Web资源的集合,包括网页多媒体内容,通常用公共域名识别,并在至少一台Web服务器上发布。著名的例子是Wikipedia .org, Google .com和Amazon.com

可以通过引用标识该网站的统一资源定位器(URL),可以通过公共Internet协议(IP)网络(例如Internet或私有局域网)访问网站。

网站可以具有许多功能,可以在各种时尚中使用;网站可以是个人网站,公司的公司网站,政府网站,组织网站等。网站通常致力于特定主题或目的,从娱乐和社交网络到提供新闻和教育。所有公共访问的网站统称构成了万维网,而私人网站(例如公司员工的网站)通常是Intranet的一部分。

网页是网站的构建块,是文档,通常用纯文本组成,上面写着超文本标记语言( HTMLXHTML )的格式指令。他们可能会结合其他网站的元素,并具有合适的标记锚。使用超文本传输​​协议(HTTP)访问和运输网页,该协议可以选择使用加密( HTTP Secure ,HTTPS)为用户提供安全性和隐私。用户的应用程序通常是Web浏览器,根据其HTML标记说明将页面内容呈现到显示终端

网页之间的超链接传达给读者网站结构并指导网站的导航,该网站通常以包含网站Web内容目录的主页开始。一些网站需要用户注册或订阅才能访问内容。订阅网站的示例包括许多业务网站,新闻网站,学术期刊网站,游戏网站,文件共享网站,留言板,基于Web的电子邮件社交网站,为不同类型市场提供实时价格报价的网站,例如以及提供其他各种服务的站点。最终用户可以访问各种设备上的网站,包括台式机笔记本电脑平板电脑,智能手机智能电视

浏览器

Web浏览器(通常称为浏览器)是用于访问万维网上信息的软件用户代理。要连接到网站的服务器并显示其页面,用户需要具有Web浏览器程序。这是用户运行的程序以下载,格式化和在用户计算机上显示网页。

除了允许用户查找,显示和移动在网页之间,网络浏览器通常还具有保留书签,录制历史记录,管理cookie(请参见下文)和主页,以及可能具有录制密码以登录登录密码的功能网站。

最受欢迎的浏览器是ChromeFirefoxSafariInternet ExplorerEdge

伺服器

Dell PowerEdge Web服务器的内部和前面,这是一台用于机架安装的计算机

Web服务器服务器软件,或者是专门用于运行的软件的硬件,可以满足万维网客户端请求。通常,Web服务器可以包含一个或多个网站。 Web服务器通过HTTP和其他几个相关协议处理传入的网络请求。

Web服务器的主要功能是将网页存储,处理和交付给客户端。客户和服务器之间的通信是使用超文本传输​​协议(HTTP)进行的。交付的页面最常是HTML文档,除文本内容外,还可能还包括图像样式表脚本

多个网络服务器可用于高流量网站;在这里,将Dell服务器安装在一起,用于Wikimedia Foundation

用户代理通常是Web浏览器Web抓取器,通过使用HTTP提出特定资源的请求来启动通信,并且服务器使用该资源的内容或错误消息响应。资源通常是服务器辅助存储中的真实文件,但不一定是这种情况,并且取决于网络服务器的实现方式。

虽然主要功能是服务内容,但HTTP的完整实施还包括从客户端接收内容的方法。此功能用于提交Web表单,包括上传文件。

许多通用的Web服务器还使用活动服务器页面(ASP), PHP (超文本预处理器)或其他脚本语言来支持服务器端脚本。这意味着可以将网络服务器的行为脚本脚本脚本脚本,而实际的服务器软件保持不变。通常,此功能用于动态生成HTML文档(“即时”),而不是返回静态文档。前者主要用于检索或修改数据库中的信息。后者通常更快,更容易缓存,但无法提供动态内容

Web服务器也经常被发现嵌入打印机路由器网络摄像头和仅提供本地网络的设备中。然后,Web服务器可以用作监视或管理相关设备的系统的一部分。这通常意味着由于仅需要Web浏览器(现在已包含大多数操作系统),因此客户端计算机上不得安装其他软件。

饼干

HTTP Cookie (也称为Web CookieInternet Cookie浏览器cookie或Simply Cookie )是从网站发送的一小部分数据,在用户浏览时用户的Web浏览器存储在用户的计算机上。 cookies被设计为可靠的机制,可以记住已记住状态信息(例如在在线商店中添加的商品中添加的项目)或记录用户的浏览活动(包括单击特定的按钮,登录或记录哪些页面已访问了哪些页面在过去)。它们还可以用来记住用户先前输入表单字段的任意信息,例如名称,地址,密码和信用卡号。

Cookies在现代网络中执行基本功能。也许最重要的是,身份验证cookie是Web服务器使用的最常见方法,以了解用户是否已登录,以及使用哪个帐户登录。没有这样的机制,该网站将不知道是发送包含敏感信息的页面还是要求用户通过登录来验证自己。身份验证cookie的安全通常取决于发行网站和用户的Web浏览器的安全性,以及是否对Cookie数据进行了加密。安全漏洞可以允许饼干的数据由黑客读取,用于访问用户数据,或用于获得cookie所属网站的访问(带有用户的凭据)(请参阅跨站点脚本交叉 -现场请求示例)。

跟踪饼干,尤其是第三方跟踪饼干,通常用作编译个人浏览历史记录的长期记录的方法 - 潜在的隐私问题,促使欧洲和美国立法者在2011年采取行动。欧洲法律要求所有网站都要求所有网站针对欧盟成员国,在将非必需的cookie存储在其设备上之前,从用户那里获得了“知情同意”。

Google Project Zero研究人员Jann Horn描述了中介人可以阅读饼干的方式,例如Wi-Fi热点提供商。他建议在这种情况下以隐身模式使用浏览器。

搜寻引擎

在基于网络的图像搜索引擎中搜索“月食”一词的结果

Web搜索引擎Internet搜索引擎是一种软件系统,旨在进行Web搜索Internet搜索),这意味着以系统的方式搜索万维网,以在Web搜索查询中指定的特定信息。搜索结果通常以结果线表示,通常称为搜索引擎结果页面(SERP)。这些信息可能是网页,图像,视频,信息图表,文章,研究论文和其他类型的文件的混合。一些搜索引擎还挖掘了数据库打开目录中可用的数据。与仅由人类编辑维护的Web目录不同,搜索引擎还通过在Web爬网上运行算法来维护实时信息。无法通过网络搜索引擎搜索的互联网内容通常描述为深网

深网

深网图
深网与表面网络
Surface Web&Deep Web

深层网络,无形的网络隐藏的网络是万维网的一部分,其内容并未由标准的Web搜索引擎索引。深层网络的相反术语是Surface Web ,使用Internet的任何人都可以访问它。计算机科学家迈克尔·伯格曼(Michael K. Bergman)因在2001年作为搜索索引术语而被认为是Deep Web一词。

深网的内容隐藏在HTTP表单后面,其中包括许多非常常见的用途,例如用户必须付费的网络银行业务和服务,并且受付费墙的保护,例如按需视频,某些在线在线杂志和报纸等。

Deep Web的内容可以通过直接URLIP地址找到和访问,并且可能需要密码或其他安全访问在公共网站页面上。

快取

Web缓存是位于公共Internet上的服务器计算机或企业中,该计算机最近存储了最近访问网页,以改善用户在原始请求之后的一定时间内请求相同内容时的响应时间。大多数Web浏览器还通过将最近获得的数据写入本地数据存储设备来实现浏览器缓存。浏览器的HTTP请求可能仅询问自上次访问以来已更改的数据。网页和资源可能包含到期信息,以控制缓存以确保敏感数据,例如在线银行业务中,或促进经常更新的网站,例如新闻媒体。即使是具有高度动态内容的网站,也只能偶尔将基本资源刷新。网站设计人员认为,值得将CSS数据(例如CSS数据)和JavaScript等资源整理到几个网站范围的文件中,以便将它们有效地缓存。企业防火墙通常会缓存一个用户为许多用户所要求的利益而要求的Web资源。一些搜索引擎存储经常访问的网站的缓存内容。

安全

对于罪犯来说,网络已成为传播恶意软件并参与一系列网络犯罪的场所,包括(但不限于)身份盗用欺诈间谍情报收集。现在,基于Web的漏洞超过了传统的计算机安全问题,并且由Google衡量,大约十分之一的网页可能包含恶意代码。大多数基于Web的攻击都是在合法网站上进行的,大多数由Sophos衡量的是在美国,中国和俄罗斯举办的。在所有恶意软件威胁中,最常见的是针对网站的SQL注入攻击。通过HTML和URIS,Web很容易受到诸如引入JavaScript的跨站点脚本(XSS)之类的攻击,并受到Web 2.0和Ajax Web设计在某种程度上加剧的,这些Web和Ajax Web设计有利于脚本的使用。如今,一项估计,所有网站中有70%向对用户的XSS攻击开放。网络钓鱼是对网络的另一个普遍威胁。 2013年2月,RSA(EMC的安全部门)估计2012年全球网络钓鱼的损失为15亿美元。两种著名的网络钓鱼方法是秘密的重定向和开放重定向。

建议的解决方案各不相同。像McAfee这样的大型安全公司已经设计治理和合规性套件,以满足9/11后的规定,而Finjan等有些公司建议对编程代码和所有内容进行积极的实时检查,而不论其来源如何。有些人认为,要使企业将网络安全视为商机,而不是成本中心,而另一些人则要求在基础架构中实施“无处不在,始终在数字权管理”中,以取代数百家确保数据和网络的公司。乔纳森·齐特雷恩(Jonathan Zittrain)表示,分担计算安全责任的用户比锁定互联网的责任更为可取。

隐私

每当客户端请求网页时,服务器都可以标识请求的IP地址。 Web服务器通常在日志文件中记录IP地址。另外,除非设置不这样做,否则大多数Web浏览器都会在可见的历史记录功能中记录所请求的网页,并且通常会在本地缓存大部分内容。除非服务器浏览器通信使用HTTPS加密,否则以纯文本为Internet,Web请求和响应可以通过中间系统查看,记录和缓存。隐藏个人身份信息的另一种方法是使用虚拟专用网络。 VPN加密在线流量并掩盖原始IP地址,以降低用户识别的机会。

当网页要求并提供个人身份信息时,例如其真实姓名,地址,电子邮件地址等。基于Web的实体可以将当前的网络流量与该个人相关联。如果网站使用HTTP Cookie ,用户名和密码身份验证或其他跟踪技术,则可以将其他Web访问与提供的可识别信息相关联。这样,基于网络的组织就可以开发和建立使用其网站或网站的个人的个人资料。它可能能够为一个人建立记录,其中包括有关其休闲活动,购物兴趣,职业以及其人口统计学概况的其他方面的信息。这些概况对营销人员,广告客户和其他人具有潜在的兴趣。根据网站的条款和条件以及应用这些配置文件信息的本地法律,可以将其出售,共享或传递给其他组织,而无需通知用户。对于许多普通人而言,这意味着其内置框中的某些意外电子邮件或将来的网页上的一些无关紧要的广告。对于其他人来说,这可能意味着,花费的时间沉迷于异常的兴趣可能会导致可能不受欢迎的进一步有针对性的营销。执法,反恐和间谍机构还可以根据网络上的利益或倾向来识别,针对和跟踪个人。

社交网站通常试图让用户使用其真实姓名,兴趣和位置,而不是假名,因为他们的高管认为这会使社交网络的体验更加吸引用户。另一方面,可以将上传的照片或无保护的陈述确定给一个人,他们可能会后悔这种暴露。雇主,学校,父母和其他亲戚可能会受到社交网络概况的各个方面(例如文本文章或数字照片)的影响,即发布个人并不打算为这些受众而言。在线欺凌者可能会利用个人信息来骚扰或跟踪用户。现代的社交网站可以为每个发布的隐私设置进行细粒度的控制,但是这些网站可能很复杂,而且不容易找到或使用,尤其是对于初学者而言。发布到网站上的照片和视频引起了特殊的问题,因为它们可以将一个人的脸添加到在线个人资料中。借助现代和潜在的面部识别技术,可能可以将面孔与其他地方成像的其他,以前的匿名,图像,事件和场景联系起来。由于图像缓存,镜像和复制,很难从万维网中删除图像。

标准

网络标准包括许多相互依存的标准和规格,其中一些控制着互联网的各个方面,而不仅仅是万维网。即使不是以Web为本,此类标准也会直接或间接影响网站和Web服务的开发和管理。考虑因素包括网页和网站的互操作性可访问性可用性

从广义上讲,网络标准包括以下内容:

Web标准不是固定的规则集,而是不断发展的Web技术最终技术规范集。 Web标准是由标准组织开发的,标准组织(有兴趣和经常涉及标准化任务的竞争政党)开发并宣布为单个个人或公司的标准技术。至关重要的是,将正在开发的规范与已经达到最终发展状态的规范(对于W3C规格,最高成熟度级别)至关重要。

可访问性

有一些方法可以访问替代媒介和格式以促进残疾人使用。这些残疾可能是视觉,听觉,身体,语音相关,认知,神经系统或某种组合。可访问性功能还可以帮助暂时残疾的人,例如手臂骨折或老化的用户随着能力的变化。网络正在接收信息,并提供信息并与社会互动。全球Web联盟声称,必须访问网络,因此它可以为残疾人提供平等的机会和平等的机会。蒂姆·伯纳斯·李(Tim Berners-Lee)曾经指出:“网络的力量在于其普遍性。每个人的访问权限无论残疾是重要的方面。”许多国家将网络访问性作为网站的要求。 W3C Web可访问性计划中的国际合作提出了简单的准则,即Web内容作者以及软件开发人员可以用来使可能使用辅助技术或可能不使用辅助技术的人访问Web。

国际化

2014年国家网络指数的全球地图

W3C国际化活动确保Web技术在所有语言,脚本和文化中都起作用。从2004年或2005年开始, Unicode获得了地面,最终于2007年12月超过了ASCII和西欧,作为网络最常用的字符编码。起初RFC 3986允许URI在US-ASCII子集中确定资源。 RFC 3987允许更多字符(通用字符集中的任何字符),现在IRI可以用任何语言来识别资源。

也可以看看