[WORLDKINGS] Top Thế Giới - Top 5 cơ sở dữ liệu lớn nhất thế giới

21-11-2021

1. Thư viện Quốc hội
 

 

Ngay cả thời đại kỹ thuật số cũng không thể ngăn cản thư viện lớn nhất thế giới lọt vào danh sách này. Thư viện Quốc hội Mỹ (Library of Congress; viết tắt : LC) tự hào có hơn 130 triệu cuốn sách, từ sách dạy nấu ăn đến báo thuộc địa cho đến các thủ tục tố tụng của chính phủ Hoa Kỳ. Người ta ước tính rằng phần văn bản của Thư viện Quốc hội Mỹ sẽ bao gồm 20 terabyte dữ liệu. LC mở rộng với tốc độ 10.000 mặt hàng mỗi ngày và chiếm gần 530 dặm không gian kệ - nói về một cuộc tìm kiếm kéo dài cho một cuốn sách.
 
Nếu bạn đang nghiên cứu một chủ đề và không thể tìm thấy thông tin phù hợp trên internet, Thư viện Quốc hội Mỹ sẽ là điểm đến mà bạn lựa chọn. Đối với những người dùng nghiên cứu lịch sử Hoa Kỳ, khoảng 5 triệu mảnh từ bộ sưu tập của LC có thể được tìm thấy trực tuyến tại American Memory.
 
2. Cơ quan tình báo trung ương
 

Cơ quan Tình báo Trung ương Mỹ (CIA) làm công việc thu thập và phân phối thông tin về con người, địa điểm và sự vật, vì vậy không có gì ngạc nhiên khi họ lọt vào danh sách này. Mặc dù ít thông tin về quy mô tổng thể của cơ sở dữ liệu của CIA, nhưng chắc chắn rằng cơ quan này đã tích lũy được rất nhiều thông tin về cả khu vực công và tư thông qua hoạt động thực địa và xâm nhập kỹ thuật số.
 
Các phần của cơ sở dữ liệu CIA có sẵn cho công chúng bao gồm Phòng đọc điện tử của Đạo luật Tự do Thông tin (FOIA), Sách Sự thật Thế giới và nhiều ấn phẩm liên quan đến tình báo khác. Thư viện FOIA bao gồm hàng trăm nghìn tài liệu chính thức (và đôi khi cực kỳ nhạy cảm) của chính phủ Hoa Kỳ được cung cấp cho công chúng dưới dạng điện tử. Thư viện phát triển với tốc độ 100 bài báo mỗi tháng và chứa các chủ đề khác nhau, từ phát triển hạt nhân ở Pakistan đến loại bia có trong Chiến tranh Triều Tiên. Sách Sự kiện Thế giới tự hào có thông tin chung về mọi quốc gia và vùng lãnh thổ trên thế giới bao gồm bản đồ, số lượng dân số, khả năng quân sự và hơn thế nữa.
 
3. ChoicePoint
 
Hãy tưởng tượng bạn phải tìm kiếm trong một danh bạ điện thoại có hàng tỷ trang cho một số điện thoại. Khi nhân viên tại ChoicePoint muốn biết điều gì đó về bạn, họ phải làm điều đó. Nếu được in ra, cơ sở dữ liệu ChoicePoint sẽ mở rộng tới mặt trăng và ngược lại 77 lần. ChoicePoint hoạt động trong lĩnh vực kinh doanh thu thập thông tin về dân số Hoa Kỳ - địa chỉ và số điện thoại, hồ sơ lái xe, tiền sử phạm tội, v.v., ChoicePoint có tất cả. Phần lớn, dữ liệu được tìm thấy trong cơ sở dữ liệu của ChoicePoint được bán cho những người trả giá cao nhất, bao gồm cả chính phủ Mỹ.
 
Nhưng ChoicePoint thực sự biết bao nhiêu? Năm 2002, ChoicePoint đã có thể giúp nhà chức trách giải quyết một vụ án hiếp dâm hàng loạt ở Philadelphia và Fort Collins sau khi đưa ra danh sách 6 nghi phạm tiềm năng bằng cách khai thác dữ liệu DNA và cơ sở dữ liệu hồ sơ cá nhân của họ. Năm 2001, ChoicePoint có thể xác định hài cốt của các nạn nhân Trung tâm Thương mại Thế giới bằng cách đối sánh DNA được tìm thấy trong các mảnh xương với thông tin do các thành viên gia đình nạn nhân cung cấp kết hợp với dữ liệu được tìm thấy trong cơ sở dữ liệu của họ.
 
4. Sprint 
 
Sprint là một trong những công ty viễn thông lớn nhất thế giới khi cung cấp dịch vụ di động cho hơn 53 triệu thuê bao và trước khi được bán vào tháng 5 năm 2006, đã cung cấp các gói cước đường dài và nội hạt.
 
Các công ty viễn thông lớn như Sprint nổi tiếng là có cơ sở dữ liệu khổng lồ để theo dõi tất cả các cuộc gọi diễn ra trên mạng của họ. Cơ sở dữ liệu của Sprint xử lý hơn 365 triệu bản ghi chi tiết cuộc gọi và các phép đo hoạt động mỗi ngày. Cơ sở dữ liệu Sprint trải rộng trên 2,85 nghìn tỷ hàng cơ sở dữ liệu khiến nó trở thành cơ sở dữ liệu có số hàng (chèn dữ liệu nếu bạn muốn) lớn nhất trên thế giới. Vào lúc cao điểm, cơ sở dữ liệu này phải chịu hơn 70.000 lượt chèn bản ghi chi tiết cuộc gọi mỗi giây.
 
5. Trung tâm Dữ liệu Thế giới về Khí hậu
 
Nếu bạn có một siêu máy tính trị giá 35 triệu euro, bạn sẽ sử dụng nó để làm gì? Thị trường chứng khoán? Xây dựng Internet của riêng bạn? Hãy thử nghiên cứu sâu rộng về khí hậu - nếu có một cỗ máy nào đó có câu trả lời cho hiện tượng nóng lên toàn cầu, thì đây có thể là nó. Được vận hành bởi Viện Khí tượng Max Planck và Trung tâm Máy tính Khí hậu Đức, Trung tâm Dữ liệu Thế giới về Khí hậu (WDCC) là cơ sở dữ liệu lớn nhất trên thế giới.
 
WDCC tự hào có 220 terabyte dữ liệu có thể truy cập dễ dàng trên web bao gồm thông tin về nghiên cứu khí hậu và các xu hướng khí hậu dự đoán, cũng như dữ liệu mô phỏng khí hậu trị giá 110 terabyte (hoặc 24.500 DVD). Trên hết, sáu petabyte thông tin bổ sung được lưu trữ trên băng từ để dễ dàng truy cập. Bạn hỏi sáu petabyte là bao nhiêu dữ liệu? Hãy thử gấp 3 lần tổng số nội dung của TẤT CẢ các thư viện nghiên cứu hàn lâm của Hoa Kỳ cộng lại.
 
Theo Liên minh Kỷ lục Thế giới (worldkings.org) 

Thanh Huyền - VietKings (biên tập và nguồn ảnh: internet)

 

Bảo tàng Kỷ lục Việt Nam mobile
Pepsi
Tổ chức Kỷ lục Châu Á
Viện Top Thế giới
Tổ chức Kỷ lục Đông Dương
Tổ chức Kỷ lục Hoa Kỳ