Cách tải file HTML


Trong quá trình lướt web chắc chắn bạn đã từng bắt gặp những website/ blog có nội dung hay,hấp dẫnrấtphù hợp công việc và sở thích học hỏi của bạn rồi đúng không?

Chắc chắn là thế rồi, ví dụ như blog mà bạn đang đọc đây, nội dung quá hấp dẫn đúng không :D.

Đùa vậy thôi, nếu như bạn thích một website nào đó mà không có thời gian đọc hết ngay được, trong khi đó máy tính ở nhà lại không có intenet thì phải làm sao?

Hoặc nghĩ đơn giản như thế này, bạn sợ một ngày nào đó website/blog đó sẽ không còn nữa thì những kiến thức quý báu sẽ biến mất trên Google và bạn sẽ không còn cơ hội để học nữa.

Chính vì thế trong bài viết ngày hôm nay, blogchiasekienthuc.com sẽ hướng dẫn chi tiết cho các bạn cách lưu lại toàn bộ trang web để bạn có thể yên tâm là nó sẽ còn mãi theo bạn.

Có nhiều phần mềm hỗ trợ cho việc này ví dụ như phần mềm WebCopier Pro, MetaProducts Portable Offline Browser, Teleport,

Nhưng ở bài viết này mình sẽ sử dụng một công cụ mà hầu như máy tính nào cũng có, đó là phần mềm tăng tốc download IDM.

I. Hướng dẫn lưu lại toàn bộ trang web về máy tính

Bên dưới mình đã tổng hợp lại những cách làm đơn giản và hiệu quả nhất. Bạn hãy đọc qua một lượt xem cách nào phù hợp thì áp dụng nhé !

#1. Cách sao lưu một Page bất kỳ

Nếu như bạn thích một trang nào đó thì chỉ việc mở bài viết đó ra và nhấn Ctrl + S => Sau đó nhấn Save để lưu lại là xong.

Cách này áp dụng cho tất cả các trình duyệt web phổ biến hiện nay ví dụ như Google Chrome, FireFox, IE, CocCoc

#2. Cách lưu lại toàn bộ trang web

Trở lại với chủ đề chính của chúng ta, cách lưu lại 1 page thì rất dễ rồi giờ chúng ta sẽ sử dụng phần mềm IDM để lưu lại toàn bộ nội dung của trang web mà chúng ta muốn.

Đầu tiên bạn mở IDM lên, tại thanh menu bạn nhấn vào Tasks => chọn Run site grabber => xuất hiện giao diện như hình bên dưới.

Bước 1: Thiết lập phương pháp tải

+Tại ô Start page/address bạn nhập website/blog mà bạn muốn tải về. Ví dụ mình sẽ nhập trang //blogchiasekienthuc.com/

+ Tại phần Project template có các tùy chọn như:

  • Custom Settings: Lựa chọn thiết lập tùy chọn, tức là nếu như bạn lựa chọn phần này thì các bước sau bạn có thể tự thiết lập bằng tay các thông số khác.
  • All pictures of the website: Có nghĩa là chỉlưu lại toàn bộ hình ảnh trên website/blog đó.
  • Audio files of start page and from one next level: Chỉ lưu lạitoàn bộ file âm thanh của trang chủ và trang cấp 1.
  • All video files of the website: Có nghĩa là chỉ lưu lạitoàn bộ phần video của website.
  • All files of the website except web pages and images: Tức là sao lưu toàn bộ thành phần của website [video, audio,] trừ các trang text và hình ảnh ra.
  • The whole website: Lưu lạitoàn bộ website [kể cả các trang thứ cấp của nó].Chế độ đầy đủ nhất đồng nghĩa với việc tốn dung lượng lưu trữ nhất
  • Complete start page with all pictures, styles, and scripts for offline browsing: Chỉ sao lưu lại trang chủ.

+ Tại phần Use authorization:

Nếu như website/blog đó yêu cầu đăng nhập thì bạn hãy tích vào ô Use authorization đó và điền thông tin vào nhé. Bạn có thể nhấn vào Advanced để tự tìm hiểu thêm một số tính năng có trong đó.

Bước 2: Thiết lập nơi lưu

+ Tại phần SaveTo sẽ có 3 lựa chọn cho bạn đó là:

  • Every file to a folder according to IDM category of the file: Có nghĩ là IDM sẽ tự động phân loại và lưu lại vào thư mục như chỉ định của IDM, ví dụ IDM thường lưu các file nén vào My Documents\Downloads\Compressed, lưu các file âm thanh vào My Documents\Downloads\Music
  • All files to the folder associated with the following IDM category: Cũng tương tựnhư tùy chọn bên trênnhưng bạn có thể thay đổi nơi lưu cho các định dạng file riêng biệt, không cầnthiết phải theo chế độ mặc định của IDM.
  • All files to the following folder: Lựa chọn này sẽ lưu tất cả cácthành phần củatrang web đóvào một thư mục duy nhất, ví dụ như mình sẽ tạo ra một Folder có tên web hay trong ổ E sau đó nhấn vào Browse.. để trỏ đến thư mục vừa tạo.

Tips: Tích vào tùy chọn Use original relative subfolders thì IDM thì khi tải về IDM sẽ lưu các thư mục con của website/blog theo đúng thứ tự gốc trên máy chủ chứa website đó.

Ngoài ra còn có các tínhnăng như:

  • Convert the links in downloaded html files to the local files for offline browsing [khuyên dùng]: Tích vào lựa chọn nàykhi duyệt web với chế độ offline được ổn định hơn.
  • Overwrite existing files: Chế độ này sẽ ghi đè lên tập tin hiện có.

Các bạn có thể thiết lập như trong hình dưới đây => sau đó nhấn Next để chuyển sang bước tiếp theo.

Bước 3: Chọn chế độ phân cấp để sao lưu

Các bạn để ý đến các tùy chọn sau:

  • Explore the whole site: Chức năng này sẽ làmặc định nếu như ở bước 1 bạn chọn chế độ lưu lại làThe whole website. Tức làhương trình sẽ sao lưu toàn bộ trang chủ [cấp 0], và các trang thứ cấp [cấp 1, 2 n].
  • Explore the specified number of link levels: Chế độ này để xácđịnh chương trình chỉ lưu lạiđến một cấp độ nào đó rồi ngừng lại. Bạn nhập số cấp độ mà mình muốn sao lưu kể từ sau trang chủ [start page] trong ô levels within the base site [thông thường là 2 hoặc 3]. Tiếp theo bạn hãynhập cấp độ các trang thứ cấp của các website khác có link hiện diện trong trang bạn muốn lưu trong ô levels on other sites,mình khuyến khích các bạn đểlà 0để tránh mất thời gian, vì bạn có thể cũng chẳng quan tâm đến nội dung của các trang này, mà chúng ta hãy tập trung vào trang web bạn đang quan tâm.
  • Ignore popup windows [khuyên dùng]: Có nghĩa là khi lựa chọn tính năng này thì khi tải về IDM sẽ không lưu lạipopup quảng cáo [nếu có].
  • Explore all sites within the main Domain: Lựa chọn này cho phép bạn lưu lại toàn bộ các trang web có cùng tên miền với trang web bạn muốn sao lưu[trong trường hợplink của các trang web này có hiện diện]. Ví dụ trang web bạn muốn sao lưu là //blogchiasekienthuc.com thì IDMsẽlưu lạicả các trang web có tên miền .com nếu các trang web đó có link trong trang //blogchiasekienthuc.com.
  • Process JavaScript: Lựa chọn chức năng này nếu bạn muốn cho các ứng dụng có liên quan đến Java cũng được sao lưu lại, nhưng nếu như bạn chưachắc chắn về mức độ an toàn của website/blogmuốn sao lưu thì không nên chọn chức năng này nhé.

Ngoài những tính năng trên bạn có thể vào thẻ Advanced để sử dụng thêm một số tùy chọn đặc biệt. Tiếp theo bạn hãy, bấm Next để chuyển sang bước cuối cùng.

Bước 4: Chọn định dạng file mà bạn muốn lưu.

Mặc định của chương trình sẽ là All Files , tức là sẽ tải về toàn bộ các định dạng file có trên website đó.

  • Search files in this site only: Có nghĩa là chỉ tìm kiếm và tải vềnhững thành phần của website bạn muốn sao lưu, không tìm kiếm ở những website khác có link nằm trong website bạn muốn lưu.
  • Hide duplicate files found in different locations: Ẩnnhững file trùng lặp ở những vị trí khác nhauđểtránh việc ghi đè lên file đang có.
  • Start downloading all matched files at once: Thực hiệnsong song việc tìm kiếm và tải vềcác file thành phần của trang web.

Tips: Bạn có thể thiết lập như hình bên dưới và nhấn vào Next để bắt đầu quá trình download, việc download nhanh hay chậm thì phục thuộc vào dung lượng của website đó.

Thường thì mất khá nhiều thời gian để tải về hoàn chỉnh một trang web.

Quá trình tải trang web đang diễn ra, bạn có thể để ẩn xuống và làm các công việc khác.

Cuối cùng là bạn vào thư mục chứa dữ liệu website vừa tải về và chạy những file có đuôi *.html để đọc nội dung nhé.

#3. Sử dụng phần mềm HTTrack Website Copier [khuyên dùng]

HTTrack Website Copier là một phần mềm chuyên dụng để hỗ trợ cho việc lưu lại nội dung toàn bộ trang web, phần mềm này sẽ giúp bạn truy cập vào một trang web offline vô cùng chuyên nghiệp, không khác gì bản trực tuyến cả.

Để dễ hình dung hơn về những gì mình đang nói thì bạn có thể xem chi tiết hơn trong bài hướng dẫn này: Làm thế nào để download toàn bộ website về máy tính?

II. Lời kết

Như vậy là bạn đã lưu lại toàn bộ trang web mà bạn cần rồi đó, việc lưu lại toàn bộ trang web là khá lâunên bạn hãy kiên nhẫn chờ đợi nhé :D. Hi vọng bài viết sẽ hữu ích cho bạn. Chúc thành công!!!

Kiên Nguyễn Blogchiasekienthuc.com
Tham khảo KHPT

Bài viết đạt: 4.7/5 sao - [Có 6 lượt đánh giá]

Video liên quan

Chủ Đề