Simulacrum, từ simulacrum Latin, là một sự bắt chước, giả mạo hoặc hư cấu. Khái niệm này được liên kết với mô phỏng, đó là hành động mô phỏng .Một...
Bài 23: Computer Vision – Lập trình AI bằng Python
Đăng bởi : Admin | Lượt xem : 4131 | Chuyên mục : AI
Thị giác máy tính tương quan đến việc quy mô hóa và tái tạo tầm nhìn của con người bằng ứng dụng và phần cứng máy tính. Trong chương này, bạn sẽ khám phá chi tiết cụ thể về điều này .
1. Thị giác máy tính :
Thị giác máy tính là ngành học nghiên cứu cách tái tạo, ngắt và hiểu một cảnh 3D từ các hình ảnh 2D của nó, xét về các đặc tính của cấu trúc có trong cảnh đó.
Bạn đang đọc: Bài 23: Computer Vision – Lập trình AI bằng Python
Hệ thống phân cấp thị giác máy tính
Thị giác máy tính được chia thành ba loại cơ bản như sau
- Low-level vision : Nó bao gồm hình ảnh quy trình để trích xuất tính năng.
- Intermediate-level vision : Nó bao gồm nhận dạng đối tượng và giải thích cảnh 3D
- High-level vision : Nó bao gồm mô tả khái niệm về một cảnh như hoạt động, ý định và hành vi.
2. Thị giác máy tính và xử lý ảnh :
Xử lý ảnh nghiên cứu và điều tra sự quy đổi ảnh sang ảnh. Đầu vào và đầu ra của quy trình giải quyết và xử lý hình ảnh đều là hình ảnh .Thị giác máy tính là việc kiến thiết xây dựng những miêu tả rõ ràng, có ý nghĩa về những đối tượng người dùng vật lý từ hình ảnh của chúng. Đầu ra của thị giác máy tính là diễn đạt hoặc diễn giải những cấu trúc trong cảnh 3D .
Applications :
Các ứng dụng chính của thị giác máy tính :
Robotics :
- Localization-determine robot location automatically
- Dẫn đường
- Tránh chướng ngại vật
- Lắp ráp (peg-in-hole, welding, painting)
- Manipulation (e.g. PUMA robot manipulator)
- Tương tác với người máy (HRI): Robot thông minh để tương tác và phục vụ con người
Y tế :
- Classification và detection (vd : phân loại tổn thương hoặc tế bào và phát hiện khối u)
- Phân đoạn 2D / 3D
- Tái tạo nội tạng người 3D (MRI hoặc siêu âm)
- Phẫu thuật robot có hướng dẫn thị giác
Bảo mật :
- Sinh trắc học (mống mắt, vân tay, nhận dạng khuôn mặt)
- Giám sát – phát hiện một số hoạt động hoặc hành vi đáng ngờ
Vận chuyển
- Xe tự hành
- An toàn(ví dụ, giám sát cảnh giác của người lái xe)
Ứng dụng tự động hóa công nghiệp
- Kiểm tra công nghiệp (phát hiện khuyết tật)
- Assembly
- Đọc mã vạch và nhãn gói
- Phân loại đối tượng
- Document understanding (e.g. OCR)
3. Cài đặt thư viện hỗ trợ :
Đối với Thị giác máy tính với Python, bạn hoàn toàn có thể sử dụng một thư viện thông dụng có tên là OpenCV ( Thị giác máy tính nguồn mở ). Nó là một thư viện những công dụng lập trình hầu hết nhắm vào thị giác máy tính thời hạn thực. Nó được viết bằng C + + và giao diện chính của nó là C + +. Bạn hoàn toàn có thể thiết lập gói này với sự trợ giúp của lệnh sau :
pip install opencv_python-X.X-cp36-cp36m-winX.whl
Ở đây X đại diện thay mặt cho phiên bản Python được setup trên máy của bạn cũng như win32 hoặc 64 bit mà bạn đang có .Nếu bạn đang sử dụng thiên nhiên và môi trường anaconda, hãy sử dụng lệnh sau để thiết lập OpenCV :
conda install -c conda-forge opencv
4. Đọc, Viết và Hiển thị Hình ảnh
Hầu hết những ứng dụng CV cần lấy hình ảnh làm đầu vào và sản xuất hình ảnh làm đầu ra. Trong phần này, bạn sẽ học cách đọc và ghi tệp hình ảnh với sự trợ giúp của những tính năng do OpenCV cung ứng .
Các chức năng OpenCV
- Hàm imread () – Đây là hàm để đọc một hình ảnh. OpenCV imread () hỗ trợ nhiều định dạng hình ảnh khác nhau như PNG, JPEG, JPG, TIFF, v.v.
- Hàm imshow () – Đây là hàm để hiển thị hình ảnh trong cửa sổ. Cửa sổ tự động phù hợp với kích thước hình ảnh. OpenCV imshow () hỗ trợ nhiều định dạng hình ảnh khác nhau như PNG, JPEG, JPG, TIFF, v.v.
- Hàm imwrite () – Đây là hàm để viết một hình ảnh. OpenCV imwrite () hỗ trợ nhiều định dạng hình ảnh khác nhau như PNG, JPEG, JPG, TIFF, v.v.
Ví dụ :
Ví dụ này sử dụng đoạn code python để đọc một hình ảnh ở một định dạng – hiển thị nó trong một hành lang cửa số và viết cùng một hình ảnh ở định dạng khác như sau :
import cv2
Đọc một hình ảnh đơn cử, sử dụng hàm imread ( )
image = cv2.imread('image_flower.jpg')
Để hiển thị hình ảnh, hãy sử dụng hàm imshow ( ). Tên của hành lang cửa số mà bạn hoàn toàn có thể thấy hình ảnh sẽ là image_flower .Ta hoàn toàn có thể viết cùng một hình ảnh sang định dạng khác, ví dụ điển hình. png bằng cách sử dụng hàm imwrite ( ) –
cv2.imwrite('image_flower.png',image)
Kết quả True có nghĩa là hình ảnh đã được ghi thành công xuất sắc dưới dạng tệp. png cũng trong cùng một thư mục .
True
Lưu ý – Hàm DestallWindows ( ) chỉ đơn thuần là hủy tổng thể những hành lang cửa số tất cả chúng ta đã tạo .
5. Chuyển đổi không gian màu :
Trong OpenCV, hình ảnh không được tàng trữ bằng cách sử dụng màu RGB thường thì, thay vào đó chúng được tàng trữ theo thứ tự ngược lại, tức là theo thứ tự BGR. Do đó, mã màu mặc định trong khi đọc ảnh là BGR. Chức năng quy đổi màu cvtColor ( ) để quy đổi hình ảnh từ mã màu này sang mã màu khác
Ví dụ :
Hãy xem xét ví dụ này để quy đổi hình ảnh từ BGR sang thang độ xám .
import cv2
Để đọc một hình ảnh đơn cử, hãy sử dụng hàm imread ( ) –
image = cv2.imread('image_flower.jpg')
nếu ta thấy hình ảnh này bằng cách sử dụng hàm imshow (), thì ta có thể thấy rằng hình ảnh này nằm trong BGR.
cv2.imshow('BGR_Penguins',image)
Sử dụng hàm cvtColor ( ) để quy đổi hình ảnh này sang thang độ xám .
image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)
6. Edge Detection
Con người, sau khi xem một bản phác thảo thô, hoàn toàn có thể thuận tiện nhận ra nhiều loại vật thể và tư thế của chúng. Đó là nguyên do tại sao những cạnh đóng một vai trò quan trọng trong đời sống của con người cũng như trong những ứng dụng của thị giác máy tính. OpenCV cung ứng hàm rất đơn thuần và hữu dụng gọi là Canny ( ) để phát hiện những cạnh .
Ví dụ :
Ví dụ sau đây cho thấy sự xác lập rõ ràng của những cạnh .
import cv2
import numpy as np
Để đọc một hình ảnh đơn cử, hãy sử dụng hàm imread ( ) .
image = cv2.imread('Penguins.jpg')
Sử dụng hàm Canny ( ) để phát hiện những cạnh của hình ảnh đã được đọc .
cv2.imwrite(‘edges_Penguins.jpg’,cv2.Canny(image,200,300))
Hiển thị hình ảnh có những cạnh, hãy sử dụng hàm imshow ( ) .
cv2.imshow(‘edges’, cv2.imread(‘‘edges_Penguins.jpg’))
Kết quả như sau :
7. Face Detection
Nhận diện khuôn mặt là một trong những ứng dụng mê hoặc của thị giác máy tính, nó làm cho nó trở nên thực tiễn hơn cũng như tương lai. OpenCV có một cơ sở tích hợp để thực thi nhận diện khuôn mặt. Chúng tôi sẽ sử dụng bộ phân loại tầng Haar để nhận diện khuôn mặt .
Dữ liệu tầng Haar
Ta cần tài liệu để sử dụng bộ phân loại tầng Haar. Bạn hoàn toàn có thể tìm thấy tài liệu này trong gói OpenCV. Sau khi setup OpenCv, bạn hoàn toàn có thể thấy tên thư mục haarcascades. Sẽ có những tệp. xml cho những ứng dụng khác nhau. Bây giờ, sao chép toàn bộ chúng để sử dụng khác nhau và dán vào một thư mục mới trong project hiện tại .
Ví dụ :
Sau đây là mã Python sử dụng Haar Cascade để phát hiện khuôn mặt của Amitabh Bachan được hiển thị trong hình ảnh sau
import cv2
import numpy as np
Sử dụng HaarCascadeClassifier để nhận diện khuôn mặt
face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')
Đọc một hình ảnh đơn cử, hãy sử dụng hàm imread ( )
img = cv2.imread('AB.jpg')
chuyển nó thành thang độ xám vì nó sẽ gật đầu hình ảnh màu xám :
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
Sử dụng face_detection.detectMultiScale , thực hiện nhận diện khuôn mặt thực tế
faces = face_detection.detectMultiScale(gray, 1.3, 5)
vẽ một hình chữ nhật xung quanh hàng loạt khuôn mặt –
for (x,y,w,h) in faces:
img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)
8. Eye Detection :
Phát hiện mắt là một ứng dụng mê hoặc khác của thị giác máy tính giúp nó trở nên trong thực tiễn hơn cũng như tương lai. OpenCV có một cơ sở tích hợp để triển khai phát hiện mắt. Chúng tôi sẽ sử dụng bộ phân loại tầng Haar để phát hiện mắt .
Ví dụ :
Đoạn code sau sử dụng Haar Cascade để phát hiện khuôn mặt của Amitabh Bachan :
import cv2
import numpy as np
Sử dụng HaarCascadeClassifier
eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')
Để đọc một hình ảnh cụ thể, hãy sử dụng hàm imread ()
Xem thêm: Tin học 12 Bài 12: Các loại kiến trúc của hệ cơ sở dữ liệu | Hay nhất Giải bài tập Tin học 12
img = cv2.imread('AB_Eye.jpg')
chuyển nó thành thang độ xám
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
Giờ đây với sự trợ giúp của eye_cascade. detectMultiScale, ta tiến hàng nhận diện khuôn mặt trong thực tiễn
eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)
vẽ một hình chữ nhật xung quanh hàng loạt khuôn mặt
for (ex,ey,ew,eh) in eyes:
img = cv2.rectangle(img,(ex,ey),(ex+ew, ey+eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)
Source: https://vh2.com.vn
Category : Tin Học