Slide bài giảng môn Internet và giao thức nội dung chương 2: Web và Http

Slide bài giảng môn Internet và giao thức nội dung chương 2: Web và Http của Học viện Công nghệ Bưu chính Viễn thông với những kiến thức và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả cao cũng như có thể vận dụng tốt những kiến thức mình đã học vào thực tiễn cuộc sống. Mời bạn đọc đón xem!

lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Ging viên: ThS. Nguyn Th Thu Hng
Đin thoi/E-mail: ptitthuhang@gmail.com
B môn: Mng vin thông - KhoaVin thông 1
Hc kỳ/Năm biên soạn: II/ 2018-2019
1
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
WWW- World Wide Web
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Tng quan v HTTP
HTTP: hypertext transfer protocol
(giao thc truyền siêu văn bản)
RFC 1945, RFC 2616
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Web và HTTP
Trang web cha các ối tượng (object)
Đối tượng có th là file HTML, hình nh JPEG, ng dng Java, file
audio,…
Trang web cha file HTML cơ bản bao gm nhiu ối tượng tham chiếu
Mi ối tượng ưc xác nh bng a ch URL Ví d v
URL:
www.someschool.edu/someDepartment/pic.gif
host name
path name
Các kết ni HTTP
S dng TCP:
1. client khi to kết ni TCP
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
(to socket) ti server, cng
80
2. server chp nhn kết ni TCP t
client
3. Các bn tin HTTP (bn tin giao
thc lp ng dụng) ược trao i
gia trình
duyt (HTTP client) và server
web (HTTP server)
4. Đóng kết ni TCP
HTTP không có trng thái
Server không duy trì thông tin v
nhng yêu cầu trước ó ca
client
Bên cnh ó
Các giao thc có duy trì trng thái
thì rt phc tp!
Trạng thái cũ (lịch s) phải ược lưu trữ
Nếu server/client b phá hng, trng thái
có th không ng nht và phi thng
nht li
1: Kết ni không n
nh
2: Kết ni n
nh
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Non-persistent HTTP
Nhiu nht mt ối tượng
ược gi qua mt kết
ni TCP .
Persistent HTTP
Nhiu ối tượng có th
ược gi trên mt
kết ni TCP gia client
và server.
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
ti www.someSchool.edu trên cng 80
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
2. Client HTTP gi bn tin yêu cu HTTP (cha
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
URL) vào socket kết ni TCP. Bn in này
cho biết client mun ối tượng
someDepartment/home.index
5. Client HTTP nhn bn tin áp ng cha file
html, hin th html. Phân tích cú pháp file
html, tìm 10 ối ng jpeg tham chiếu.
www.someSchool.edu ch kết ni TCP
cổng 80. “chấp nhận” kết ni và báo
cho client
3. Server HTTP nhn bn tin yêu cu, to ra bn tin
áp ng cha ối tượng yêu cu gi bn tin vào
socket ca nó.
4. Server HTTP óng kết ni TCP.
6. Lp lại các bước t 1-5 vi tng ối tượng jpeg ó.
HTTP không n nh (Non-Persistent HTTP): Thi
gian áp ng
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
server và phn hi tr li.
Thi gian áp ng:
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Mt RTT dùng khi to kết ni TCP
HTTP n nh (Persistent HTTP)
Non-persistent HTTP : Persistent HTTP
Mi ối tượng cn 2 Server kết ni m sau khi gi
RTT áp ng
Mào u OS cho mi Các bn tin HTTP ca cùng cp kết ni TCP client/server
ược gi trên kết
Các trình duyt
ni m ó
thường m song song client gi các yêu cu bt c khi mt s kết ni
TCP nào nó gp ối tượng tham ly các ối tượng chiếu
tham chiếu Ch cn mt RTT cho tt c các
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
ối tượng tham chiếu
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Hai loi bn tin HTTP: request (yêucu), response (ápng)
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Các mã trng thái phn hi HTTP
Trong dòng u bn tin phn hi server client Mt vài
mã mu:
200 OK
Yêu cu thành công, ối tượng yêu cu xut hin phía sau trong bn tin này.
301 Moved Permanently
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Đã bỏ ối tượng yêu cu, v trí mi s ược c t phía sau trong bn tin này (Location:)
400 Bad Request
Server không hiu bn tin yêu cu
404 Not Found
Tài liu yêu cu không tìm thy trong server này
505 HTTP Version Not Supported
Phiên bn giao thc HTTP yêu cầu không ược máy ch h tr.
Tương tác người dùng-máy ch: Cookie
Rt nhiu trang Web s dng cookie.
Các cookie (RFC 2965) cho phép im truy
nhp bám vết người s dng.
Bn thành phn:
1) Dòng header cookie trong bn tin áp
ng HTTP
2) Dòng header cookie trong
bn tin yêu cu HTTP
3) Tp cookie gi máy trm
user, do trình duyt ca
user iu khin
4) Cơ sở d liu u cui (back-
end) trang Web
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Ví d:
Susan thường truy nhp Internet t PC
Ln u vào một trang thương mại in t c
th
Khi khi ng yêu cu HTTP
ti trang này thì trang này s
to ra:
ID duy nht
Mt mục trong cơ sở d liu u
xa cho ID ó
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Cookies (cont.)
Cookies có th mang li :
Bên cnh ó
Cookies và s riêng tư:
U quyn
cookies cho phép các trang web
Xe hàng hoá biết nhiu v bn
Khuyến ngh Có th bn s cung cp tên và
Trạng thái phiên người a ch email cho các trang này dùng (Web e-mail)
Làm thế nào gi “trng thái”:
Đim cui giao thc: duy trì trng thái phía gi/nhn qua các giao dch cookies:
bn tin http mang trng thái
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Mc ích/thành qu: áp ng yêu cu ca client mà không cn s tham gia ca server
ban u origin
server
u, sau ó tr ối tượng cho origin client server
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Hiu thêm v Web caching
Cache hot ộng như client và
server
Thường thì cache do ISP khi
tạo (trường i hc, công ty,
ISP dân cư)
Vì sao lại lưu ệm Web?
Để gim thi gian áp ng
yêu cu ca client
Để làm giảm lưu lượng trên
liên kết truy nhp ca t
chc.
Internet dy c cache: cho
phép các nhà cung cp ni
dung “nghèo nàn” th
truyn ni dung hiu qu
(cũng giống chia s file P2P)
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Ví d v cache (cont)
origin
Gii pháp kh thi 2: lp t cache
servers
Gi s t l truy vn vào cache là 0,4
Mng
Internet
Kết qu
40% yêu cu gần như thoả mãn tc thì
60% yêu cu do server ban u áp 1,5 Mbps
ng Liên kết truy nhp
Độ s dng trên liên kết truy nhp Mạng trường gim xung còn 60%, dn ến
tr
i hc
10 Mbps LAN gim xung rt nh (10 msec)
Tng tr trung bình = Internet delay + access delay +
LAN delay
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
cache
= (0,6*2,01secs + 0,4*milliseconds)
1,21 secs
cache server
HTTP có cơ chế cho phép tra HTTP request msg cu vic ối tượng trong
cache If-modified-since:
ã ược cp nhật hay chưa <date> Đối tượng
Nó s không gi ối tượng nếu không thay cache ã cp nht phiên bn HTTP
response i mi. 304 Not ModifiedHTTP/1.0
cache: ch ra ngày ca bn sao cached trong
yêu cu HTTP
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
HTTP request msg
If-modified-since: <date> If-modified-since:
server: phn hồi nhưng không <date> Đối tượng gi ối tượng nào nếu copy ca
thay i
cache là cp nht : HTTP response
HTTP/1.0 200 OK
HTTP/1.0 304 Not Modified <data>
Tng kết
Khái nim HTTP
Tng quan HTTP
Phân bit Non-persistent HTTP vi Persistent HTTP
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
Khuôn dng bn tin HTTP: Bn tin yêu cu, bn tin áp ng.
Khái nim cookie, li ích và nhng c im.
Gii pháp cache.
Khái nim conditional Get và mi liên h vi cache và
server web.
Hc vin Công ngh u chính Viễn thông
https://portal.ptit.edu.vn/
lOMoARcPSD|36067889
Internet và giao thc
Downloaded by D?a (nyeonggot7@gmail.com)
| 1/28

Preview text:

lOMoARcPSD| 36067889 Internet và giao thức Giảng viên:
ThS. Nguyễn Thị Thu Hằng Điện thoại/E-mail: ptitthuhang@gmail.com Bộ môn:
Mạng viễn thông - KhoaViễn thông 1
Học kỳ/Năm biên soạn: II/ 2018-2019 1
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức WWW- World Wide Web
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức Tổng quan về HTTP
HTTP: hypertext transfer protocol
(giao thức truyền siêu văn bản) RFC 1945, RFC 2616
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức Web và HTTP
Trang web chứa các ối tượng (object)
Đối tượng có thể là file HTML, hình ảnh JPEG, ứng dụng Java, file audio,…
Trang web chứa file HTML cơ bản bao gồm nhiều ối tượng tham chiếu
Mỗi ối tượng ược xác ịnh bằng ịa chỉ URL Ví dụ về URL:
www.someschool.edu/someDepartment/pic.gif host name path name Các kết nối HTTP Sử dụng TCP: 1.
client khởi tạo kết nối TCP
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
(tạo socket) tới server, cổng
Server không duy trì thông tin về 80
những yêu cầu trước ó của client 2.
server chấp nhận kết nối TCP từ client 3.
Các bản tin HTTP (bản tin giao Bên cạnh ó
thức lớp ứng dụng) ược trao ổi
Các giao thức có duy trì trạng thái giữa trình thì rất phức tạp!
duyệt (HTTP client) và server
Trạng thái cũ (lịch sử) phải ược lưu trữ web (HTTP server)
Nếu server/client bị phá hỏng, trạng thái 4. Đóng kết nối TCP
có thể không ồng nhất và phải thống HTTP không có trạng thái nhất lại 1: Kết nối không ổn ịnh 2: Kết nối ổn ịnh
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức Non-persistent HTTP kết nối TCP giữa client
Nhiều nhất một ối tượng và server. ược gửi qua một kết nối TCP . Persistent HTTP
Nhiều ối tượng có thể ược gửi trên một
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
HTTP không ổn ịnh (Non persistent HTTP)
Giả sử người sử dụng vào URL 11 ối tượng: Tệp HTML cơ www.someSchool.edu/someDepartment/home.index bản và 10 hình ảnh jpeg
1a. Client HTTP khởi tạo kết nối TCP
tới server HTTP (process-tiến trình) 1b. Server HTTP tại trạm chủ
tại www.someSchool.edu trên cổng 80
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
2. Client HTTP gửi bản tin yêu cầu HTTP (chứa
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
URL) vào socket kết nối TCP. Bản in này cho client
cho biết client muốn ối tượng someDepartment/home.index
3. Server HTTP nhận bản tin yêu cầu, tạo ra bản tin
áp ứng chứa ối tượng yêu cầu và gửi bản tin vào socket của nó.
5. Client HTTP nhận bản tin áp ứng chứa file
html, hiển thị html. Phân tích cú pháp file
html, tìm 10 ối tượng jpeg tham chiếu.
4. Server HTTP óng kết nối TCP.
www.someSchool.edu chờ kết nối TCP ở
cổng 80. “chấp nhận” kết nối và báo
6. Lặp lại các bước từ 1-5 với từng ối tượng jpeg ó.
HTTP không ổn ịnh (Non-Persistent HTTP): Thời gian áp ứng
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
server và phản hồi trở lại. Thời gian áp ứng:
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Một RTT dùng ể khởi tạo kết nối TCP
HTTP ổn ịnh (Persistent HTTP) Non-persistent HTTP : Persistent HTTP Mỗi ối tượng cần 2
Server ể kết nối mở sau khi gửi RTT áp ứng
Mào ầu OS cho mỗi Các bản tin HTTP của cùng cặp kết nối TCP client/server ược gửi trên kết nối mở ó Các trình duyệt
thường mở song song client gửi các yêu cầu bất cứ khi một số kết nối
TCP ể nào nó gặp ối tượng tham lấy các ối tượng chiếu tham chiếu
Chỉ cần một RTT cho tất cả các
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức ối tượng tham chiếu
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Hai loại bản tin HTTP: request (yêucầu), response (ápứng)
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Các mã trạng thái phản hồi HTTP
Trong dòng ầu bản tin phản hồi server client Một vài mã mẫu: 200 OK
Yêu cầu thành công, ối tượng yêu cầu xuất hiện phía sau trong bản tin này. 301 Moved Permanently
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Đã bỏ ối tượng yêu cầu, vị trí mới sẽ ược ặc tả phía sau trong bản tin này (Location:) 400 Bad Request
Server không hiểu bản tin yêu cầu 404 Not Found
Tài liệu yêu cầu không tìm thấy trong server này
505 HTTP Version Not Supported
Phiên bản giao thức HTTP yêu cầu không ược máy chủ hỗ trợ.
Tương tác người dùng-máy chủ: Cookie
Rất nhiều trang Web sử dụng cookie. 2) Dòng header cookie trong
Các cookie (RFC 2965) cho phép iểm truy bản tin yêu cầu HTTP
nhập bám vết người sử dụng.
3) Tệp cookie giữ ở máy trạm user, do trình duyệt của Bốn thành phần: user iều khiển
1) Dòng header cookie trong bản tin áp
4) Cơ sở dữ liệu ầu cuối (back- ứng HTTP end) ở trang Web
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức Ví dụ:
tới trang này thì trang này sẽ tạo ra:
Susan thường truy nhập Internet từ PC ID duy nhất
Lần ầu vào một trang thương mại iện tử cụ thể
Một mục trong cơ sở dữ liệu ầu xa cho ID ó
Khi khởi ộng yêu cầu HTTP
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức Cookies (cont.)
Cookies có thể mang lại : Bên cạnh ó Cookies và sự riêng tư: Uỷ quyền
cookies cho phép các trang web Xe hàng hoá biết nhiều về bạn Khuyến nghị
Có thể bạn sẽ cung cấp tên và
Trạng thái phiên người ịa chỉ email cho các trang này dùng (Web e-mail)
Làm thế nào ể giữ “trạng thái”:
Điểm cuối giao thức: duy trì trạng thái ở phía gửi/nhận qua các giao dịch cookies:
bản tin http mang trạng thái
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Mục ích/thành quả: áp ứng yêu cầu của client mà không cần sự tham gia của server ban ầu origin server
ầu, sau ó trả ối tượng cho origin client server
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức Hiểu thêm về Web caching
Cache hoạt ộng như client và
Để làm giảm lưu lượng trên server
liên kết truy nhập của tổ chức.
Thường thì cache do ISP khởi
tạo (trường ại học, công ty,
Internet dầy ặc cache: cho ISP dân cư)
phép các nhà cung cấp nội Vì sao lại lưu ệm Web?
dung “nghèo nàn” có thể
truyền nội dung hiệu quả
Để giảm thời gian áp ứng
(cũng giống chia sẻ file P2P) yêu cầu của client
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức Ví dụ về cache (cont) origin
Giải pháp khả thi 2: lắp ặt cache servers
Giả sử tỷ lệ truy vấn vào cache là 0,4 Mạng Internet Kết quả
40% yêu cầu gần như thoả mãn tức thì
60% yêu cầu do server ban ầu áp 1,5 Mbps ứng Liên kết truy nhập
Độ sử dụng trên liên kết truy nhập
Mạng trường giảm xuống còn 60%, dẫn ến trễ ại học
10 Mbps LAN giảm xuống rất nhỏ (10 msec)
Tổng trễ trung bình = Internet delay + access delay + LAN delay
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức cache
= (0,6*2,01secs + 0,4*milliseconds) 1,21 secs cache server
HTTP có cơ chế cho phép tra HTTP request msg cứu việc ối tượng trong cache If-modified-since:
ã ược cập nhật hay chưa Đối tượng
Nó sẽ không gửi ối tượng nếu
không thay cache ã cập nhật phiên bản HTTP
response ổi mới. 304 Not ModifiedHTTP/1.0
cache: chỉ ra ngày của bản sao cached trong yêu cầu HTTP
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức HTTP request msg If-modified-since: If-modified-since:
server: phản hồi nhưng không
Đối tượng gửi ối tượng nào nếu copy của thay ổi cache là cập nhật : HTTP response HTTP/1.0 200 OK HTTP/1.0 304 Not Modified Tổng kết Khái niệm HTTP Tổng quan HTTP
Phân biệt Non-persistent HTTP với Persistent HTTP
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Khuôn dạng bản tin HTTP: Bản tin yêu cầu, bản tin áp ứng.
Khái niệm cookie, lợi ích và những ặc iểm. Giải pháp cache.
Khái niệm conditional Get và mối liên hệ với cache và server web.
Học viện Công nghệ Bưu chính Viễn thông https://portal.ptit.edu.vn/
Downloaded by D?a (nyeonggot7@gmail.com) lOMoARcPSD| 36067889 Internet và giao thức
Downloaded by D?a (nyeonggot7@gmail.com)