Hello,

Sign in to find your next job.

Blog IT

PDF đã âm thầm trở thành định dạng tệp tin quan trọng nhất thế giới như thế nào?

PDF đã âm thầm trở thành định dạng tệp tin quan trọng nhất thế giới như thế nào?

Định dạng tài liệu di động (Portable Document Format) thường được biết tới với cái tên viết tắt là PDF. Đây là một định dạng tệp tin văn bản cực kỳ phổ biến được phát triển bởi hãng Adobe.

Khi muốn tải tài liệu từ Internet xuống, bạn sẽ rất dễ dàng bắt gặp định dạng PDF. Chính vì quá phổ biến, PDF đã khiến không ít người dùng Internet bình thường phải đau đầu. Nguyên nhân là do tất cả tài liệu dùng định dạng PDF đều không cho phép sửa chữa dễ dàng như định dạng Word thông thường.

Ông Paul Manafort.

Một trường hợp gặp rắc rối gần đây với định dạng file PDF là Paul Manafort, cựu quản lý chiến dịch tranh cử của Tổng thống Donald Trump. Luật sư của Bộ Tư pháp Mỹ Robert Mueller mới đây đã chỉ trích Paul Manafort và đồng nghiệp Richard Gates vì cố tình tìm cách sửa đổi một tệp tin tài liệu PDF. Ông Manafort đã dùng phần mềm để chuyển đổi tài liệu định dạng PDF sang định dạng Word, chỉnh sửa nhiều nội dung trong đó và chuyển lại thành định dạng PDF.

Luật sư Robert Mueller đã gọi hành vi này của ông Manafort là "manh mối giấy", ám chỉ nó sẽ được dùng làm bằng chứng chống lại ông Manafort tại tòa. Ông Manafort hiện đang bị điều tra về tội "phản quốc" do bị tình nghi giúp Nga thao túng cuộc bầu cử Mỹ trong năm 2016.

Thông thường, định dạng PDF không nhận được nhiều sự chú ý như vậy. Mặc dù được sử dụng rất nhiều, nguồn gốc và cách PDF chinh phục cả thế giới lại được ít người biết tới. Câu chuyện của PDF không thú vị như MP3, định dạng âm nhạc được ra đời cùng bài hát "Tom's Dinner" của ca sĩ Suzanne Vega hoặc tốn nhiều giấy mực như tệp tin ZIP, ra đời nhờ vào tranh cãi pháp lý giữa hai hãng System Enhancement Associates và PKWARE.

Mặc dù vậy, PDF vẫn có một câu chuyện riêng của nó và định dạng tài liệu này sẽ còn nhiều tiềm năng hơn nữa để phát triển trong tương lai. Nhà báo Ernie Smith tới từ trang công nghệ Motherboard đã vừa tổng hợp thông tin từ nhiều nguồn để đem tới cho bạn một cái nhìn đầy đủ nhất về PDF, định dạng tệp tin quan trọng nhất hiện nay:

Đồng sáng lập Adobe John E. Warnock.

"Những gì mà ngành công nghiệp thật sự cần là một cách đồng nhất để giao tiếp tài liệu giữa một số lượng lớn máy tính, hệ điều hành và mạng lưới giao tiếp. Tài liệu cần có khả năng xem trên bất cứ màn hình nào và có thể in trên bất cứ máy in nào. Nếu vấn đề này được giải quyết, cách làm việc của con người cơ bản sẽ thay đổi".

Đó là những lời được John E. Warnock, đồng sáng lập của Adobe, phát biểu trong buổi công bố dự án "The Camelot" về sự cần thiết của một định dạng tài liệu tiêu chuẩn. Ông Warnock là người từng chịu trách nhiệm phát triển ngôn ngữ PostScript trước đây của Adobe. Tuy nhiên, ông Warnock cho rằng PostScript và ngôn ngữ anh em của nó là Display PostScript quá nặng để chạy được trên đa phần máy tính trong những năm đầu của thập niên 90.

"Display PostScript và PostScript sẽ là giải pháp dài hạn khi sức mạnh của máy tính được nâng cấp dần dần. Tuy nhiên, đối với những máy tính hiện nay (thập niên 90 của thế kỷ 20), hai giải pháp này không thật sự hữu ích với đa phần người dùng", ông Warnock cho biết.

PDF lúc đầu chỉ là giải pháp thay thế ngắn hạn cho PostScript.

Do đó, dự án "The Camelot" của ông Warnock đã được ra đời như là một giải pháp ngắn hạn nhằm tạo ra một định dạng tệp tin đáp ứng được hầu hết máy tính trong thời điểm năm 1990. Về lâu dài, Adobe vẫn muốn PostScript là giải pháp dài hạn trong tương lai. Tuy nhiên, mọi chuyện lại không hề diễn ra theo ý muốn ban đầu của họ.

Trong khoảng thời gian ông Warnock và đồng nghiệp đang cố gắng tìm ra một định dạng tệp tin có thể đọc trên mọi máy tính khác nhau, Sở thuế vụ Mỹ (IRS, Internal Revenue Service) đang gặp một vấn đề đau đầu với công ty Dịch vụ Bưu chính Mỹ (US Postal Service).

Cụ thể, hàng năm, trước thời điểm thu thuế theo quy định, IRS sẽ gửi biểu mẫu thuế tới hàng triệu người Mỹ. Theo như một bài báo đăng trên tờ New York Times năm 1991, công ty Dịch vụ Bưu chính Mỹ sẽ phải gửi tới 110 triệu lá thư chứa biểu mẫu thuế mỗi năm. Và IRS sẽ phải quản lý và xử lý từng đó biểu mẫu thuế khác nhau dành cho từng doanh nghiệp và người nộp thuế.

Gửi hàng trăm triệu lá thư là một sự lãng phí vô cùng lớn. Đối với một tổ chức luôn đề cao việc hạn chế thất thu như IRS, lãng phí là điều tối kỵ. Hơn nữa, IRS cũng rất muốn hạn chế hình ảnh về một Chính phủ Mỹ bị ngập đầu trong đống giấy tờ và thủ tục "nhiều khê" đối với người dân.

Trong trường hợp này, một định dạng tệp tin có thể đọc trên mọi loại máy tính thật sự cần thiết. Ở thời điểm năm 1990, một số giải pháp giúp đọc văn bản trên nhiều loại máy tính như TurboTax trên PC và MacInTax trên máy tính Mac đã xuất hiện. Tuy nhiên, IRS lại chưa có cách nào để giúp người Mỹ tin tưởng hoàn toàn vào máy tính trong việc nộp thuế.

Phiên bản Acrobat Reader 1.0 trong năm 1992.

May mắn thay, Adobe đã sẵn sàng cho một sự thay đổi. Vào năm 1992, dự án "The Camelot" được đổi tên thành PDF. Cũng trong năm này, Adobe lần đầu tiên giới thiệu công nghệ định dạng tệp tin PDF dưới cái tên thương hiệu là Acrobat Reader tại hội chợ thương mại COMDEX.

Nhiều tờ báo đã ngay lập tức ca ngợi Acrobat nhờ vào khả năng hiển thị và in tất cả các loại tài liệu trên mọi loại máy tính khác nhau. Thậm chí, Acrobat còn được phong tặng danh hiệu "Best of Show" (sản phẩm tốt nhất của hội chợ) năm đó.

Tuy nhiên, như ông Warnock thừa nhận, điều ông hướng tới khi tạo ra PDF không chỉ đơn giản là muốn mọi người đọc và in tài liệu dễ dàng hơn. Sự thật, ông muốn mọi người sẽ gửi tài liệu điện tử tới nhau một cách dễ dàng hơn.

"Khi Acrobat được giới thiệu, thế giới đã không hiểu đúng về nó. Họ không hiểu được tầm quan trọng của việc gửi tài liệu điện tử sẽ như thế nào", ông Warnock.

Video giới thiệu phiên bản Acrobat Reader 1.0 của Adobe.

Mặc dù vậy, nhờ vào sự ca ngợi của báo chí, IRS đã để mắt tới PDF. Một công nghệ nhận được nhiều sự quan tâm sẽ rất dễ dàng để triển khai trên diện rộng. Nhờ đó, Adobe đã được trao cơ hội để cho cả thế giới thấy PDF có tiềm năng lớn tới nhường nào.

Theo trang tin NetworkWorld, IRS đã bắt đầu gửi các biểu mẫu thuế dưới định dạng PDF tới các công ty Mỹ từ năm 1994. Đây được coi là bước đệm cho sự phát triển về sau này của định dạng PDF.

Tuy nhiên, yếu tố quan trọng nhất dẫn tới sự phổ biến của PDF chính là sự xuất hiện của trang web. Theo thông tin của Kim Komado, người dẫn chương trình cho series hướng dẫn sử dụng máy tính Komputer Kindergarten nổi tiếng, IRS đã cho tải lên trang web của họ tới 600 tài liệu thuế dưới định dạng PDF để các công ty có thể dễ dàng tải xuống vào năm 1996.

Một nghiên cứu của Adobe cho thấy IRS đã chuyển tất cả tài liệu của họ sang định dạng PDF và cung cấp phần mềm Acrobat Reader cho hơn 100.000 nhân viên sử dụng định dạng này vào năm 2001. Nhờ vậy, IRS đã tiết kiệm được hàng triệu USD tiền giấy và in ấn.

Ngoài việc giảm chi phí, PDF còn giúp IRS tra cứu tài liệu dễ dàng hơn. Thay vì tìm kiếm tài liệu trong tủ hồ sơ, thanh tra và kiểm toán viên của IRS có thể dễ dàng tra cứu thông tin dựa vào các tài liệu PDF đã được tải lên web.

"Dựa vào sự hài lòng của nhân viên, Acrobat thật sự đáng tiền", một quan chức của IRS cho biết, "Nhờ vào việc lưu trữ và tra cứu dễ dàng hơn, rõ ràng là Acrobat và Adobe PDF đã đem lại những lợi ích thiết thực cho IRS và những người dân đang được chúng tôi phục vụ".

Bên cạnh đó, một điều khiến IRS thích nhất ở PDF là khả năng tạo ra những biểu mẫu có thể điền được. Nhờ đó, IRS có thể tạo ra những biểu mẫu thuế cho phép các công ty điền mã số thuế hoặc thậm chí là chữ ký của họ. Điều này giúp tiết kiệm chi phí đi lại của nhân viên IRS và người dân.

Một thời gian ngắn sau khi được IRS sử dụng, PDF đã nhanh chóng trở thành một trong những cách quan trọng nhất để người dùng doanh nghiệp Mỹ chia sẻ tài liệu. Không lâu sau, đến các trường đại học cũng nhận thấy tầm quan trọng và bắt đầu sử dụng PDF.

Nhờ ưu điểm đọc được trên nhiều loại máy tính khác nhau, PDF rất được dân văn phòng tin dùng khi gửi tài liệu.

Cho đến tận ngày nay, PDF vẫn là định dạng tệp tin quan trọng hàng đầu. Mọi tài liệu trước khi gửi đều được khuyến khích chuyển sang định PDF. Nếu sử dụng định dạng Word, tài liệu sẽ không thể hiển thị giống nhau trên các máy tính khác nhau vì bị phụ thuộc vào font chữ và phiên bản Word. Tuy nhiên, tài liệu PDF lại ngược lại khi luôn hiển thị giống nhau trên mọi loại máy tính và thậm chí là smartphone. Hơn nữa, PDF cũng hỗ trợ rất tốt cho những tài liệu scan từ giấy. Nhờ vậy, dân văn phòng trên khắp thế giới đều tin dùng PDF trong công việc hàng ngày.

Và cứ như vậy, PDF đã thay thế cho PostScript để trở thành giải pháp dài hạn trong tham vọng tiêu chuẩn hóa mọi loại tài liệu của Adobe. Khi PDF đã được chấp nhận rộng rãi trên phạm vi toàn cầu, Adobe không có nhiều lý do để phát triển PostScript.

PDF đã trở thành một tiêu chuẩn toàn cầu trong việc lưu trữ và gửi tài liệu.

"PDF đã trở thành tiêu chuẩn toàn cầu cho việc trao đổi thông tin an toàn và đáng tin cậy hơn kể từ khi Adobe công bố phiên bản PDF hoàn chỉnh vào năm 1993. Cả chính phủ lẫn doanh nghiệp tư nhân đều đều dựa vào PDF để gửi và chia sẻ tài liệu, và trong nhiều trường hợp là lưu trữ cho các thế hệ sau", đại diện của Tổ chức Tiêu chuẩn hóa Quốc tế (ISO, International Organization for Standardization) phát biểu khi gắn chuẩn ISO 32000-1 cho phiên bản PDF 1.7 trong năm 2008.

Mặc dù Adobe là công ty đầu tiên tạo ra PDF, hãng lại cho phép người dùng và các công ty khác đóng góp cũng như sử dụng nó. Nói cách khác, PDF đã trở thành một tiêu chuẩn tự thỏa thuận giữa các công ty khi gửi tài liệu cho nhau. Điều này thật sự khác biệt vì Adobe thường tính phí các công cụ do hãng tạo ra.

Tới năm 2007, Adobe quyết định hợp tác với ISO để thống nhất những tiêu chuẩn cũng như phát triển định dạng PDF về sau. Động thái này nhằm khẳng định mức độ phổ biến và tầm ảnh hưởng của PDF đối với người dùng trên toàn thế giới.

Tiêu chuẩn hóa mọi thứ có thể rất nhàm chán. Tuy nhiên, trong công việc lưu trữ, điều này lại rất quan trọng. Tiêu chuẩn hóa giúp cho tài liệu của bạn có thể dễ dàng tìm kiếm được giữa một số lượng tài liệu đồ sộ. Hơn nữa, tiêu chuẩn hóa cũng giúp cho tài liệu có thể xem trên mọi loại thiết bị khác nhau.

Chính vì lý do này, chuẩn PDF/A đã được ra mắt vào năm 2005. Đây là chuẩn PDF được yêu cầu bởi Hiệp hội Các nhà cung cấp In ấn, xuất bản và chuyển đổi công nghệ (Association for Suppliers of Printing, Publishing and Converting Technologies, NPES) và Hiệp hội Quốc tế về Thông tin và Quản lý hỉnh ảnh (Association for Information and Image Management, AIIM).

Điểm đặc biệt của PDF/A so với các chuẩn PDF khác đó là khả năng tái tạo nội dung và không cho phép điền thêm bất cứ dữ liệu nào từ bên ngoài. Một tài liệu sử dụng chuẩn PDF/A là hoàn toàn khép kín và chỉ được sử dụng font chữ bản quyền.

"Mọi thứ cần phải có khi lưu trữ tài liệu đều có trong PDF/A như font chữ, màu sắc và hình ảnh. PDF/A cũng là một tiêu chuẩn của tổ chức ISO nhằm đảm bảo tất cả thế hệ phần mềm trong tương lai đều có thể mở và đọc được tài liệu PDF/A", chuyên gia công nghệ Shawna McAlearney giải thích.

Đối với các tổ chức lưu trữ như Thư viện Quốc hội Mỹ (Library of Congress), chuẩn PDF/A rất quan trọng vì họ cần giữ mọi loại tài liệu trong vòng ít nhất là 30 năm. Mặc dù rất được tin dùng nhưng PDF/A vẫn dẫn tới một số tranh cãi.

Ví dụ, trong năm 2012, khi Adobe cho phép phiên bản mở rộng của PDF/A được phép nhúng bảng tính và tài liệu HTML, nhiều lo ngại về tính khép kín của tài liệu đã xuất hiện. Một số chuyên gia như Marco Klindt tới từ Viện Zeus tại Berlin (Đức) còn cho rằng định dạng PDF/A rất tốt khi được dùng để in ấn nhưng bất tiện để sử dụng.

"Sự phổ biến của PDF đã giúp PDF/A được nhanh chóng sử dụng như một giải pháp lưu trữ đáng tin cậy", ông Klindt nói, "Tuy nhiên, điều này vô tình khiến chúng ta quên đi việc tạo ra phương thức lưu trữ cho những nội dung cần phải sửa chữa vì nghiên cứu lại".

Mặc dù vậy. hàng năm vẫn có hàng triệu tài liệu được chuyển thành dạng PDF để lưu trữ trên toàn thế giới. PDF/A đã trở thành một tiêu chuẩn trong ngành lưu trữ và được dùng để truyền đạt kiến thức của chúng ta tới thế hệ mai sau.

Trong vòng ít nhất là 50 năm tới, chúng ta sẽ ghi chép lịch sử vào những tài liệu PDF. Và không giống như tài liệu giấy, tài liệu PDF không thể bị hỏng hóc theo thời gian. Nói cách khác, kể từ thế hệ của chúng ta, lịch sử sẽ được viết dưới định dạng PDF.

Mặc dù hiện nay, chúng ta đang được thấy định dạng tài liệu PDF ở khắp mọi nơi trên Internet. Tuy nhiên, Adobe đã từng có ý định ngừng phát triển PDF khi ông Warnock muốn dừng thu phí sử dụng định dạng này. Đây là một hành động được ông Warnock mô tả là "vô cùng mạo hiểm" vì Adobe chưa hề miễn phí cho bất cứ thứ gì hãng tạo ra. Tuy nhiên, sau nhiều nỗ lực, ông Warnock cuối cùng cũng thuyết phục được ban lãnh đạo Adobe tiếp tục phát triển định dạng PDF.

"Khi ban lãnh đạo Adobe muốn ngừng phát triển PDF", ông Warnock cho biết, "Tôi đã nói: "Không đời nào. PDF là cách giải quyết cho một vấn đề quan trọng và chúng ta sẽ tiếp tục phát triển nó".

Không phải Photoshop, PDF mới là bước đệm thành công của Adobe.

PDF không giúp Adobe thu về được nhiều lợi nhuận (phần mềm Acrobat Reader chỉ tính phí cho phiên bản Premium). Tuy nhiên, chính quyết định miễn phí PDF đã đem tới cho Adobe chìa khóa thành công vì giúp hãng được biết tới nhiều hơn. Nhiều người luôn nghĩ Photoshop là phần mềm nổi tiếng nhất của Adobe nhưng sự thật lại không phải như vậy. Phần mềm nổi tiếng nhất và là bước đệm thành công về sau này của Adobe chính là định dạng tệp tin PDF do ông Warnock tạo ra.

"PDF mới là thứ đã đưa cái tên Adobe lên bản đồ công nghệ thế giới", đạo diễn nổi tiếng Jason Matthew Smith cho biết.

theo VnReview

Nguồn: Ictnews.vn

Similar blogs