Hoạt động của các Công cụ tìm kiếm - Thanh'sBlog - Blog công nghệ, chia sẻ niềm đam mê!

Hoạt động của các Công cụ tìm kiếm Không rõ

07/01/2017 Đăng bởi: Lover Admin , Nhận xét(0) , Đọc(347) Lớn | Vừa | Nhỏ

Highslide JS
Kết quả tìm kiếm bánh xèo.

Ai đã dùng máy tính và lên mạng Internet thì chắc đều biết dùng những phần mềm như Google hay Bing để tìm kiếm về bất cứ một vấn đề gì đó.

Thí dụ bạn muốn làm bánh xèo, bạn vào Google và gõ vào hai chữ “bánh xèo” thì lập tức trong 0.65 giây Google nói có tới 1 triệu 400 ngàn kết quả. Ðây là trang đầu mà Google trình ra.

Nếu bạn gõ chữ “banh xeo” không bỏ dấu thì cũng được, nhưng chỉ có 430 ngàn kết quả và mất tới 0.98 giây. Nhiều khi bạn tự hỏi “sao cái gì nó cũng biết?” Có người đã gọi Google là “ông thần Gu Gồ,” nên muốn biết gì thì cứ hỏi “Thần Gu Gồ.”
Google hay Bing hoặc Yahoo! là những phần mềm đặc biệt gọi là công cụ tìm kiếm (search engine) dùng để tìm bất cứ cái gì bạn có thể nghĩ tới.Nhiều người cũng nhờ công cụ tìm kiếm để viết bài. Nếu không có công cụ tìm kiếm thì phải ra thư viện tìm tòi sách vở mất rất nhiều thời giờ.

Trong bài này chúng ta nói sơ qua về một vài công cụ tìm kiếm và cách hoạt động của các công cụ tìm kiếm.

Một vài công cụ tìm kiếm đáng kể

Từ khi có máy tính nhiều người đã nghĩ đến việc thu thập tất cả các kiến thức và thông tin trên liên mạng thông tin toàn cầu vào những dụng cụ điện tử để cho tiện dụng.
Tôi còn nhớ khoảng năm 1989 ông Bill Gates tới thuyết trình tại Bell Labs, New Jersey, ông đã bàn tới vấn đề mà ông gọi là “information at your fingertips” (thông tin ở ngay đầu ngón tay của bạn).
Lúc đó ông nói về bách khoa tự điển Encarta mà Microsoft đang phát triển. Encarta được chính thức tung ra thị trường vào năm 1993 trong 4 CD và bán kèm theo máy tính cá nhân. Ông không tiên đoán được sự bùng nổ của Internet, nên chỉ chú trọng đến sự phát triển các phần mềm cho máy tính.
Kết quả là Encarta không cạnh tranh được với các công cụ tìm kiếm trên Internet và Microsoft phải khai tử Encarta vào năm 2009. Bây giờ đúng là “thông tin ở ngay đầu ngón tay,” nhưng là qua mạng lưới thông tin toàn cầu và các công cụ tìm kiếm, chứ không phải qua máy tính.
Từ thập niên 1990 đến nay đã có nhiều người và công ty cho ra đời nhiều công cụ tìm kiếm, sau đây là một vài công cụ đáng kể.
– Archie, được coi là công cụ tìm kiếm đầu tiên trên mạng. Công cụ này do ông Alan Emtage, lúc ấy là một sinh viên tại đại học McGill University ở Montreal, Canada, tạo nên vào năm 1990.
– Yahoo!, tạo thành vào năm 1994 do hai ông David Flo va Jerry Yang. Lúc mới ra, Yahoo! được rất nhiều người dùng. Bây giờ vẫn còn nhưng thua xa Google.
– Alta Vista, ra đời năm 1995. Lúc mới ra Alta Vista có nhiều đặc điểm hay nên khá nổi tiếng, nhưng rồi cuối cùng cũng bị đi vào quên lãng.
– MSN Search, công ty Microsoft tung ra MSN Search vào năm 1998, sau này đổi tên là Bing.
– Google, được chính thức tung ra thị trường năm 1998, tuy trước đó được dùng trong nội bộ Ðại Học Stanford. Sinh sau đẻ muộn nhưng Google dần dần trở thành công cụ tìm kiếm hàng đầu thế giới.

Theo trang mạng www.whoishostingthis.com, có bốn công cụ tìm kiếm đang chế ngự thị trường trên thế giới.
– Google chiếm 70% của thị trường.
– Bing đứng thứ nhì với khoảng hơn 10%.
– Baidu đứng thứ ba, ít hơn 10% một chút. Ðược biết Baidu là công cụ tìm kiếm của Trung Quốc. Google đang bị cấm bên Trung Quốc vì lý do gì thì chắc độc giả ai cũng biết. Trung Quốc là một nước độc tài nên rất sợ sự thật, như vậy không thể để ông thần Google vào được.
– Yahoo! đồng hạng ba với Baidu.

Highslide JS
Bên trong trung tâm dữ liệu của Google.


Cách hoạt động của công cụ tìm kiếm

Liên mạng thông tin toàn cầu rất lớn và hỗn độn, cho tới bây giờ đã có trên 1 tỉ trang mạng (website), nên khó có thể tìm được gì nếu không nhờ vào một công cụ tìm kiếm. Nhưng công cụ tìm kiếm hoạt động ra sao để có thể giúp người dùng tìm kiếm? Có ba bài toán chính của một công cụ tìm kiếm:
– Làm sao khám phá được hết nội dung của các trang mạng một cách liên tục và tự động.
– Làm sao để sắp xếp mọi nội dung vào một danh mục (index).
– Làm sao để trình bày kết quả một cách thỏa đáng cho người sử dụng.

Làm sao công cụ tìm kiếm biết hết mọi nội dung?

Việc đầu tiên một công cụ tìm kiếm làm là dùng một chương trình gọi là “web crawler” để tự động đi từ đường liên kết (link) này tới đường liên kết khác trên mạng và gom góp thông tin của các trang mạng. Dữ liệu tối thiểu mà một công cụ tìm kiếm thu thập là tên mạng, hình ảnh, những từ chính (keyword) và những đường liên kết với các trang khác. Vì mạng thay đổi liên tục nên công cụ tìm kiếm cũng phải luôn luôn tiếp tục thu thập dữ liệu của các trang mạng mới và những thay đổi của các trang mạng cũ.

Làm sao công cụ tìm kiếm sắp xếp các dữ liệu?

Sau khi có nhiều dữ liệu thì công cụ tìm kiếm phải sắp xếp các dữ liệu đó vào một danh mục và để vào một cơ sở dữ liệu (database). Cơ sở dữ liệu này chứa hầu hết tất cả những thông tin trên thế giới. Như bạn thấy ở thí dụ nơi đầu bài, tìm chữ “bánh xèo” mà đã có tới 1.4 triệu kết quả. Tìm chữ “Việt Nam” thì có tới 704 triệu kết quả. Vì có nhiều dữ liệu như vậy nên cơ sở dữ liệu phải nói là khổng lồ. Ðây là hình ảnh trong một trung tâm dữ liệu của Google (nguồn: www.google.com).

Highslide JS

Sắp hạng

Khi bạn gõ chữ “bánh xèo” vào ô tìm kiếm của Google thì Google tìm thấy có tới 1.4 triệu trang mạng có liên quan tới bánh xèo. Họ phải quyết định trình bày cái nào trước, cái nào sau, tức là phải sắp hạng kết quả để người sử dụng tìm thấy cái gì mình muốn tìm trong vòng một vài trang đầu. Ðối với người sử dụng đây là yếu tố quan trọng nhất của một công cụ tìm kiếm, vì nếu không trình cho tôi cái tôi muốn tìm thì tôi sẽ dùng công cụ tìm kiếm khác. Google sở dĩ vượt lên được tất cả các công cụ tìm kiếm khác là vì cách sắp hạng và truy tìm của Google hay hơn hẳn các công cụ tìm kiếm khác.

Có rất nhiều yếu tố ảnh hưởng tới việc sắp hạng. Những yếu tố đáng kể là:
– Sự phổ biến, nhiều người vào thăm trang nào thì trang ấy có trọng lượng hơn trang ít người tới viếng.
– Có nhiều đường liên kết, trang nào càng có nhiều đường liên kết từ những trang mạng khác thì càng nặng ký.
– Vị trí, thí dụ tôi gõ chữ “phở” trong ô tìm kiếm thì những tiệm phở ở gần chỗ tôi đang dùng máy tính sẽ hiện ra trước những tiệm phở ở chỗ khác.

Trên đây chỉ là một vài yếu tố, Google tuyên bố là họ dùng tới hơn 200 yếu tố và những thuật toán tinh vi để xếp hạng.
Vấn đề sắp hạng này rất quan trọng cho những công ty, vì nếu công ty mình luôn luôn được Google cho lên hàng đầu thì sẽ có nhiều người vào trang mạng của mình và nhiều người mua hàng hay đến cửa hàng của mình.
Ngược lại nếu công ty bị xếp hạng một trăm ngoài thì chắc ít người tới, vì nhu cầu này nên đã nảy sinh ra một ngành gọi là “tối ưu cho công cụ tìm kiếm (search engine optimization SEO)” để dạy cho các công ty làm sao đem hạng của mình lên cao.

Highslide JS
––––––––—-
Nguồn tài liệu:
nguoivietonline



Nhấn Like và +1 nếu thấy bài viết có ý nghĩa!

  • Đăng lên ZingMe
  • Đăng Lên Facebook
  • Đăng Lên Twitter
  • LinkedIn
  • Đăng lên ZingMe
  • Đăng Lên Google Buzz
  • Đăng Lên FriendFeed
  • Đăng Lên Reddit
  • Đăng Lên MySpace
  • Đăng Lên Yahoo! Bookmarks
  • Đăng Lên Digg
  • Đăng Lên Yahoo Buzz
  • Đăng Lên Baidu
Đăng bình luận lên Facebook của bạn:
Khuyến cáo: Không hổ trợ comment bằng facebook nhé!

Tags: , , , , , , ,
Viết nhận xét

Tên gọi

Facebook của bạn

Email

You can also login with your OpenID:
HTML code BBcode Mặt cười Ẩn giấu Hãy nhớ [Đăng nhập] [Đăng ký. ]
               
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot

Bạn muốn hình đại diện hiển thị ngay bên cạnh lời bình luận của bạn không?
Hãy tham gia vào Gravatar và thiết lập hình đại diện hoàn toàn miễn phí!
Gravatar là gì? Avatar hình đại diện toàn cầu, bạn đã có avatar chưa? click đăng ký ngay!
TÌNH HÌNH WEBSITE

Thống kê Online trên website.

Hiện có 128 người đang online
(0 thành viên và 128 khách)

Tổng quan tình hình trên ThanhBlog.InFo

Thống kê đến thời điểm hiện tại số lượt khách ghé thăm blog là: 4067984
Số người đã ghé thăm blog trong ngày là: 675
Số bài viết: 6856 Số comment hiện tại là: 2843 Số trích dẫn 1
Số thành viên đã đăng ký là: 24357
Nào cùng nâng ly chào mừng bạn leducthoq6 đến với ThanhBlog. Chúc các bạn có những giây phút bổ ích và hạnh phúc !