Computer Vision là gì? Sự khác biệt giữa Computer Vision và Image Processing

Computer Vision đã là khái niệm không còn lạ gì đối với những người trong ngành CNTT hay ngành kỹ thuật số. Nhưng vẫn có nhiều người vẫn chưa biết đến khái niệm Computer Vision là gì? Mặc dù khái niệm này được sử dụng nhiều trong quá trình trao đổi hay bàn luận. Bài viết dưới đây chúng tôi sẽ giúp bạn tìm hiểu về Computer Vision.

Giới thiệu về Computer Vision

Computer vision được dịch ra là thị giác máy tính hay tầm nhìn máy tính. Thuật ngữ này được sử dụng nhiều trong các ngành liên quan về máy tính, kỹ thuật thông tin hay ngành kỹ thuật số.

Computer Vision là gì?

Computer Vision là gì?

Đây là một khái niệm đại diện cho lĩnh vực khoa học liên quan đến cách thức máy tính có thể được tạo ra để có được sự hiểu biết cao cấp từ các hình ảnh hoặc video kỹ thuật số. Từ quan điểm của một kỹ thuật, nó sẽ tự động hóa các nhiệm vụ mà hệ thống thị giác của con người có thể làm được.

Nhiệm vụ của computer vision gồm các phương pháp để có thể thu nhập, xử lý, phân tích và hình ảnh kỹ thuật số và trích xuất được dữ liệu chiều cao từ thế giới thực để có thể tạo ra các thông tin bằng số hoặc biểu tượng. Những ngành khoa học về tầm nhìn máy tính liên quan đến lý thuyết ở đằng sau các hệ thống nhân tạo sẽ trích xuất thông tin từ hình ảnh. Dữ liệu ảnh có thể có nhiều dạng. Ví dụ như: chuỗi video, chế độ xem từ nhiều camera, hoặc là dữ liệu đa chiều từ máy quét y tế.

Những miền con của computer vision gồm tái tạo lại cảnh, phát hiện ra sự kiện, theo dõi video, có thể nhận dạng đối tượng, ước tính được tư thế 3D, học tập, lập chỉ mục, ước tính được chuyển động và có thể phục hồi lại được hình ảnh.

Bạn đọc tham khảo thêm: Computer Science là gì– Những thông tin về ngành khoa học máy tính

Quy trình mô phỏng thị giác con người

Quy trình mô phỏng thị giác con người được chia thành 3 giai đoạn đó là:

Quy trình mô phỏng thị giác con người gồm 3 giai đoạn

Quy trình mô phỏng thị giác con người gồm 3 giai đoạn

  • Mô phỏng mắt – thu nhận

Mô phỏng mắt chính là lĩnh vực mà chúng ta đạt được nhiều thành công nhất. Trong vài chục năm qua, con người đã tạo được cảm biến, vi xử lý hình ảnh giống với khả năng nhìn của mắt người.

Những thấu kính lớn hơn, hoàn hảo về mặt quang học cùng với những điểm ảnh phụ bán dẫn nhỏ tới mức nano mét giúp cho các camera ngày nay có độ chính xác và nhạy đáng kinh ngạc. Camera có thể chụp hàng ngàn hình ảnh ở mỗi giây và nhận diện từ xa với độ chính xác cao.

  • Mô phỏng vỏ não thị giác – xử lý

Bộ não được xây dựng bắt đầu từ con số 0 với các hình ảnh dần dần lấp đầy tâm trí, nó làm nhiệm vụ liên quan đến hệ thị giác nhiều hơn bất kỳ công việc nào khác và việc này đều xuống tới cấp độ tế bào. Hàng tỉ những tế bào để phối hợp để lấy ra những hình mẫu, bắt được tín hiệu.

Một nhóm nơron sẽ báo cho các nhóm khác khi có sự khác biệt dọc theo một đường thẳng. Nghiên cứu đầu tiên về thị giác máy tính đã cho rằng mạng lưới nơron phức tạp tới nỗi không thể hiểu nổi khi mà tiếp cận chúng theo hướng lý giải từ trên xuống dưới. Với một số đối tượng khác thì cách này cũng là một cách hiệu quả nhưng khi mô tả từng đối tượng từ nhiều góc nhìn sẽ biến thể về màu sắc, chuyển động và nhiều thứ khác như hình dung sẽ khó thế nào.

  • Mô phỏng phần còn lại của bộ não – phân tích

Ta có thể xây dựng một hệ thống nhận diện được một quả cam từ bất cứ góc nào, trong tình huống nào. Dù đứng im hay chuyển động thì chúng không thể nhận diện được một quả táo, không thể nói cho ta quả cam là gì? có ăn được hay không, lớn nhỏ ra sao hay nó dùng để làm gì. Như thế, phần cứng và phần mềm tốt cũng không được làm gì nếu không có hệ điều hành. 

Đây chính là phần còn lại của não bộ, bộ nhớ ngắn/dài hạn hay dữ liệu từ những giác quan, sự chú ý, nhận thức, bài học tương đương với hệ thống, được viết lên mạng lưới nổn kết nối phức tạp hơn bất cứ thứ gì mà chúng ta từng thấy, theo cách đó mà chúng ta không thể hiểu. Đây là nơi khoa học máy tính và trí tuệ nhân tạo gặp mặt.

Bạn đọc tham khảo thêm: Scrum master là gì? Làm thế nào để trở thành một scrum master

Các lĩnh vực liên quan đến Computer Vision

Khoa học máy tính hiện nay đã phát triển không ngừng và tiến sâu vào cuộc sống của con người ở trong mọi lĩnh vực trong đời sống. Dưới đây là những lĩnh vực tiêu biểu mà Computer Vision liên quan đến:

Những ứng dụng của thị giác máy tính trong đời sống

Những ứng dụng của thị giác máy tính trong đời sống

  • Trí tuệ nhân tạo

Các lĩnh vực về trí tuệ nhân tạo đối phó với kế hoạch tự trị hoặc cân nhắc cho các hệ thống robot điều hướng trong cùng một môi trường. Một sự hiểu biết chi tiết về các môi trường này chính là sự cần thiết để có thể điều hướng chúng. Những thông tin về môi trường có thể được cung cấp bởi một hệ thống thị giác máy tính, hoạt động như một cảm biến tầm nhìn và cung cấp những thông tin cấp cao về môi trường và robot.

Trí tuệ nhân tạo và thị giác máy tính sẽ chia sẻ những chủ đề khác nhau như: nhận dạng mẫu, kỹ thuật học tập. Vì thế, thị giác máy tính đôi khi còn được xem là một phần của lĩnh vực trí tuệ nhân tạo hoặc lĩnh vực khoa học máy tính nói chung.

  • Lĩnh vực sinh học thần kinh

Đây là một lĩnh vực thứ 3 đóng vai trò quan trọng, đặc biệt đó là nghiên cứu hệ thống thị giác sinh học. Trong những thế kỷ qua, đã có một nghiên cứu sâu rộng về mắt, tế bào thần kinh và cấu trúc não dành cho việc xử lý các kích thích thị giác ở cả người và động vật. Điều này dẫn đến một mô tả thô nhưng khá phức tạp về cách mà các hệ thống tầm nhìn “thực” hoạt động để có thể giải quyết các nhiệm vụ liên quan đến một tầm nhìn nhất định. 

Kết quả này đã dẫn đến một trường con trong thị giác máy tính, nơi các hệ thống nhân tạo được thiết kế để có thể bắt chước được quá trình xử lý và hành vi của các hệ thống sinh học, ở mức độ phức tạp khác nhau.

  • Xử lý tín hiệu

Hiện có nhiều phương pháp xử lý tín hiệu một biến, điển hình là tín hiệu thời gian. Nó có thể mở rộng theo cách tự nhiên để có thể xử lý tín hiệu 2 biến hoặc tín hiệu đa biến trong computer vision. Nhưng do tính chất cụ thể của hình ảnh, nên sẽ có nhiều phương pháp được phát triển trong tầm nhìn máy tính mà không có đối tác trong việc xử lý tín hiệu một biến. Cùng với tính đa chiều của tín hiệu, điều này xác định một trường con trong xử lý tín hiệu là một phần của computer vision.

Trên đây là một số thông tin về thị giác máy tính – computer vision. Hy vọng qua bài viết này, các bạn có thêm được những kiến thức mới lạ và hiểu được computer vision là gì?

 

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *