AI

AI developers are threatening Wikipedia's existence

Bùi Đăng MinhSunday, April 6, 2025, 14:00 (GMT+7)4 min read
AI developers are threatening Wikipedia's existence
Automated data mining software is creating a cost burden for Wikipedia. Photo: Digital Information World
Automated data mining software is creating a cost burden for Wikipedia. Photo: Digital Information World

Wikipedia, one of the most massive sources of knowledge ever built, containing contributions from millions of people around the world, is facing a growing threat from artificial intelligence developers, according to New Scientist.

The non-profit organization Wikimedia Foundation, which operates Wikipedia, said that since January 2024, the number of network traffic to download images and videos from the site's catalog increased by 50%. That surge comes largely from automated data mining programs that developers use to gather training data for their AI models. The unprecedented increase in traffic means the Wikimedia Foundation has to spend more money to serve the encyclopedia's pages and other content from its rented data centers.

"There are many other reports of content sites being similarly affected, but when a hugely important site like Wikimedia makes the issue public, people take notice," said AI researcher Elena Simperl at King's College London. "The issue they are discussing is very worrying."

Theo Quỹ Wikimedia, 65% lượng truy cập Internet tốn kém nhất của họ đến từ phần mềm tự động khai thác dữ liệu. Chúng thường yêu cầu bài báo ít phổ biến và những truy vấn này phải chuyển tới trung tâm dữ liệu trung tâm thay vì sử dụng bộ nhớ đệm của bài báo phổ biến lưu trữ ở trung tâm dữ liệu địa phương. "Lượng sử dụng cao cũng gây rắc rối thường xuyên cho đội kỹ sư quản lý độ tin cậy trang web của chúng tôi. Họ buộc phải chặn lượng truy cập áp đảo từ các phần mềm đó trước khi nó tạo ra vấn đề cho người đọc", Quỹ Wikimedia chia sẻ.

Birgit Müller, giám đốc sản xuất ở Quỹ Wikimedia, cho biết tổ chức này đang tìm cách quản lý lượng truy cập từ phần mềm tự động và sẽ yêu cầu người dùng thương mại như nhà phát triển AI "trực tiếp hỗ trợ tính bền vững cho các dự án Wikimedia. "Một vấn đề thường bị xem nhẹ đối với nội dung công khai là nội dung cho phép truy cập miễn phí nhưng cơ sở hạ tầng để vận hành lại mất phí", Simperl nhấn mạnh.

The Wikimedia Foundation has published a draft plan to identify the developers behind data mining software with the goal of reducing automated traffic from there in terms of bandwidth by 30%. Wikimedia also faces direct competition from AI chatbots that can answer questions on a variety of topics, even if the AI ​​responses are not always factual. Although Wikimedia sites have not seen a decline in direct traffic due to recent developments in AI, Müller expressed concern that AI services that use Wikimedia content to provide automated summaries and quick answers often do not provide full citations and prevent people from accessing the original source of information.

However, the Wikimedia Foundation is not opposed to using AI technology. Họ đã khai thác công cụ AI để giúp biên tập viên phát hiện hành vi phá hoại ở các trang Wikipedia, dự đoán chất lượng bài báo, đo độ tin cậy và gợi ý chỉnh sửa.

An Khang (According to New Scientist)

Nguồn / Original source: VnExpress