தமிழ்

பட அங்கீகார ஏபிஐ-கள் மூலம் கணினிப் பார்வை உலகை ஆராயுங்கள். இந்த தொழில்நுட்பங்களின் செயல்பாடு, பயன்பாடுகள் மற்றும் சரியான ஏபிஐ-யை தேர்ந்தெடுப்பது பற்றி அறியுங்கள். டெவலப்பர்கள், ஆராய்ச்சியாளர்கள், மற்றும் AI-யில் ஆர்வமுள்ளவர்களுக்கு ஏற்றது.

கணினிப் பார்வை: பட அங்கீகார ஏபிஐ-களில் ஒரு ஆழமான பார்வை

கணினிப் பார்வை, செயற்கை நுண்ணறிவின் (AI) ஒரு துறையாகும், இது கணினிகளுக்கு மனிதர்களைப் போலவே படங்களைப் "பார்க்கவும்" மற்றும் புரிந்துகொள்ளவும் அதிகாரம் அளிக்கிறது. இந்தத் திறன் சுகாதாரம் மற்றும் உற்பத்தி முதல் சில்லறை விற்பனை மற்றும் பாதுகாப்பு வரை பல்வேறு தொழில்களில் பரந்த அளவிலான சாத்தியங்களைத் திறக்கிறது. பல கணினிப் பார்வை பயன்பாடுகளின் மையத்தில் பட அங்கீகார ஏபிஐ-கள் உள்ளன, இவை டெவலப்பர்கள் சிக்கலான மாதிரிகளை புதிதாக உருவாக்கத் தேவையில்லாமல், தங்கள் பயன்பாடுகளில் அதிநவீன பட பகுப்பாய்வு செயல்பாடுகளை ஒருங்கிணைக்க அனுமதிக்கும் சக்திவாய்ந்த கருவிகளாகும்.

பட அங்கீகார ஏபிஐ-கள் என்றால் என்ன?

பட அங்கீகார ஏபிஐ-கள் என்பவை கிளவுட் அடிப்படையிலான சேவைகளாகும், அவை படங்களைப் பகுப்பாய்வு செய்து நுண்ணறிவுகளை வழங்க முன்-பயிற்சி செய்யப்பட்ட இயந்திர கற்றல் மாதிரிகளைப் பயன்படுத்துகின்றன. அவை பல்வேறு பணிகளைச் செய்கின்றன, அவற்றுள்:

இந்த ஏபிஐ-கள் விரிவான இயந்திர கற்றல் நிபுணத்துவம் அல்லது குறிப்பிடத்தக்க கணினி வளங்கள் தேவைப்படாமல் கணினிப் பார்வையின் சக்தியைப் பயன்படுத்த ஒரு எளிய மற்றும் திறமையான வழியை வழங்குகின்றன. அவை பொதுவாக ஏபிஐ-யின் சேவையகத்திற்கு ஒரு படத்தை அனுப்புவதன் மூலம் செயல்படுகின்றன, அது பின்னர் படத்தைச் செயலாக்கி, முடிவுகளை JSON போன்ற ஒரு கட்டமைக்கப்பட்ட வடிவத்தில் திருப்பி அனுப்புகிறது.

பட அங்கீகார ஏபிஐ-கள் எப்படி வேலை செய்கின்றன

பட அங்கீகார ஏபிஐ-களின் பின்னணியில் உள்ள தொழில்நுட்பம் முதன்மையாக ஆழமான கற்றல் ஆகும், இது இயந்திர கற்றலின் ஒரு துணைக்குழுவாகும், இது தரவைப் பகுப்பாய்வு செய்ய பல அடுக்குகளைக் கொண்ட செயற்கை நரம்பியல் நெட்வொர்க்குகளைப் பயன்படுத்துகிறது (அதனால் "ஆழமானது"). இந்த நெட்வொர்க்குகள் மிகப்பெரிய படத் தரவுத்தொகுப்புகளில் பயிற்சி அளிக்கப்படுகின்றன, இது மனிதர்கள் கைமுறையாக அடையாளம் காணக் கடினமான சிக்கலான வடிவங்களையும் அம்சங்களையும் கற்றுக்கொள்ள அனுமதிக்கிறது. பயிற்சி செயல்முறையானது நெட்வொர்க்கிற்கு மில்லியன் கணக்கான படங்களை அளித்து, படங்களில் குறிப்பிடப்பட்டுள்ள பொருள்கள் அல்லது கருத்துக்களைத் துல்லியமாக அடையாளம் காணும் வரை நெட்வொர்க்கின் அளவுருக்களை சரிசெய்வதை உள்ளடக்கியது.

நீங்கள் ஒரு படத்தை பட அங்கீகார ஏபிஐ-க்கு அனுப்பும்போது, ஏபிஐ முதலில் அதன் அளவு, நிறம் மற்றும் நோக்குநிலையை இயல்பாக்க படத்தை முன்-செயலாக்குகிறது. பின்னர், முன்-செயலாக்கப்பட்ட படம் ஆழமான கற்றல் மாதிரியில் செலுத்தப்படுகிறது. மாதிரி படத்தைப் பகுப்பாய்வு செய்து, ஒவ்வொன்றும் அதனுடன் தொடர்புடைய நம்பிக்கை மதிப்பெண்ணுடன் கூடிய கணிப்புகளின் தொகுப்பை வெளியிடுகிறது. ஏபிஐ பின்னர் இந்தக் கணிப்புகளை ஒரு கட்டமைக்கப்பட்ட வடிவத்தில் திருப்பி அனுப்புகிறது, இது உங்கள் பயன்பாட்டில் முடிவுகளை எளிதாக ஒருங்கிணைக்க அனுமதிக்கிறது.

பட அங்கீகார ஏபிஐ-களின் பயன்பாடுகள்

பட அங்கீகார ஏபிஐ-களின் பயன்பாடுகள் நம்பமுடியாத அளவிற்கு பன்முகத்தன்மை கொண்டவை மற்றும் பல தொழில்களில் பரவியுள்ளன. இங்கே சில எடுத்துக்காட்டுகள்:

இ-காமர்ஸ்

சுகாதாரம்

உற்பத்தி

பாதுகாப்பு மற்றும் கண்காணிப்பு

சமூக ஊடகம்

விவசாயம்

சரியான பட அங்கீகார ஏபிஐ-யை தேர்ந்தெடுப்பது

பல பட அங்கீகார ஏபிஐ-கள் இருப்பதால், உங்கள் தேவைகளுக்கு சரியான ஒன்றைத் தேர்ந்தெடுப்பது ஒரு சவாலான பணியாக இருக்கலாம். கருத்தில் கொள்ள வேண்டிய சில காரணிகள் இங்கே:

பிரபலமான பட அங்கீகார ஏபிஐ-கள்

தற்போது கிடைக்கக்கூடிய சில பிரபலமான பட அங்கீகார ஏபிஐ-கள் இங்கே:

நடைமுறை எடுத்துக்காட்டுகள்: பட அங்கீகார ஏபிஐ-களைப் பயன்படுத்துதல்

பட அங்கீகார ஏபிஐ-கள் நிஜ உலக சூழ்நிலைகளில் எவ்வாறு பயன்படுத்தப்படலாம் என்பதை நடைமுறை எடுத்துக்காட்டுகளுடன் விளக்குவோம்.

எடுத்துக்காட்டு 1: ஒரு இ-காமர்ஸ் வலைத்தளத்திற்கு காட்சித் தேடல் அம்சத்தை உருவாக்குதல்

நீங்கள் ஆடை விற்கும் ஒரு இ-காமர்ஸ் வலைத்தளத்தை உருவாக்குகிறீர்கள் என்று கற்பனை செய்து கொள்ளுங்கள். பயனர்கள் வேறு எங்காவது பார்த்த ஒரு பொருளின் படத்தைப் பதிவேற்றுவதன் மூலம் தயாரிப்புகளைக் கண்டறிய அனுமதிக்க விரும்புகிறீர்கள்.

இந்த அம்சத்தை செயல்படுத்த பட அங்கீகார ஏபிஐ-யை எவ்வாறு பயன்படுத்தலாம் என்பது இங்கே:

  1. பயனர் படத்தைப் பதிவேற்றுகிறார்: பயனர் தாங்கள் தேடும் ஆடைப் பொருளின் படத்தைப் பதிவேற்றுகிறார்.
  2. ஏபிஐ-க்கு படத்தை அனுப்புங்கள்: உங்கள் பயன்பாடு படத்தை பட அங்கீகார ஏபிஐ-க்கு (எ.கா., Google Cloud Vision API) அனுப்புகிறது.
  3. ஏபிஐ படத்தை பகுப்பாய்வு செய்கிறது: ஏபிஐ படத்தை பகுப்பாய்வு செய்து, ஆடைப் பொருளின் வகை (உடை, சட்டை, பேன்ட்), நிறம், பாணி மற்றும் வடிவங்கள் போன்ற முக்கிய பண்புகளை அடையாளம் காண்கிறது.
  4. உங்கள் பட்டியலைத் தேடுங்கள்: உங்கள் பயன்பாடு ஏபிஐ-யால் திருப்பியளிக்கப்பட்ட தகவலைப் பயன்படுத்தி உங்கள் தயாரிப்புப் பட்டியலில் பொருந்தும் பொருட்களைத் தேடுகிறது.
  5. முடிவுகளைக் காட்டுங்கள்: உங்கள் பயன்பாடு தேடல் முடிவுகளை பயனருக்குக் காட்டுகிறது.

குறியீடு துணுக்கு (கருத்தியல் - பைதான் உடன் Google Cloud Vision API):

குறிப்பு: இது விளக்க நோக்கங்களுக்கான ஒரு எளிமைப்படுத்தப்பட்ட எடுத்துக்காட்டு. உண்மையான செயல்படுத்தலில் பிழை கையாளுதல், ஏபிஐ விசை மேலாண்மை மற்றும் மேலும் வலுவான தரவு செயலாக்கம் ஆகியவை அடங்கும்.


from google.cloud import vision

client = vision.ImageAnnotatorClient()
image = vision.Image()
image.source.image_uri = image_url  # பதிவேற்றப்பட்ட படத்தின் URL

response = client.label_detection(image=image)
labels = response.label_annotations

print("குறிச்சொற்கள்:")
for label in labels:
    print(label.description, label.score)

# குறிச்சொற்களைப் பயன்படுத்தி உங்கள் தயாரிப்புப் பட்டியலைத் தேடவும்...

எடுத்துக்காட்டு 2: ஒரு சமூக ஊடக தளத்தில் உள்ளடக்க தணிக்கையை தானியக்கமாக்குதல்

நீங்கள் ஒரு சமூக ஊடக தளத்தை உருவாக்குகிறீர்கள் மற்றும் நிர்வாணம் அல்லது வன்முறை கொண்ட படங்கள் போன்ற பொருத்தமற்ற உள்ளடக்கத்தைத் தானாகக் கண்டறிந்து அகற்ற விரும்புகிறீர்கள்.

உள்ளடக்க தணிக்கையை செயல்படுத்த பட அங்கீகார ஏபிஐ-யை எவ்வாறு பயன்படுத்தலாம் என்பது இங்கே:

  1. பயனர் படத்தைப் பதிவேற்றுகிறார்: ஒரு பயனர் உங்கள் தளத்தில் ஒரு படத்தைப் பதிவேற்றுகிறார்.
  2. ஏபிஐ-க்கு படத்தை அனுப்புங்கள்: உங்கள் பயன்பாடு படத்தை பட அங்கீகார ஏபிஐ-க்கு (எ.கா., Amazon Rekognition) அனுப்புகிறது.
  3. ஏபிஐ படத்தை பகுப்பாய்வு செய்கிறது: ஏபிஐ பொருத்தமற்ற உள்ளடக்கத்திற்காக படத்தை பகுப்பாய்வு செய்கிறது.
  4. நடவடிக்கை எடுக்கவும்: ஏபிஐ அதிக நம்பிக்கையுடன் பொருத்தமற்ற உள்ளடக்கத்தைக் கண்டறிந்தால், உங்கள் பயன்பாடு தானாகவே படத்தை நீக்குகிறது அல்லது கைமுறை மதிப்பாய்வுக்குக் கொடியிடுகிறது.

குறியீடு துணுக்கு (கருத்தியல் - பைதான் உடன் Amazon Rekognition):


import boto3

rekognition_client = boto3.client('rekognition')

with open(image_path, 'rb') as image_file:
    image_bytes = image_file.read()

response = rekognition_client.detect_moderation_labels(Image={'Bytes': image_bytes})

moderation_labels = response['ModerationLabels']

for label in moderation_labels:
    print(label['Name'], label['Confidence'])
    if label['Confidence'] > 90: # நம்பிக்கை வரம்பை தேவைக்கேற்ப சரிசெய்யவும்
        # நடவடிக்கை எடுக்கவும்: படத்தை நீக்கவும் அல்லது மதிப்பாய்வுக்குக் கொடியிடவும்
        print("பொருத்தமற்ற உள்ளடக்கம் கண்டறியப்பட்டது! நடவடிக்கை தேவை.")

உலகளாவிய டெவலப்பர்களுக்கான செயல் நுண்ணறிவுகள்

பட அங்கீகார ஏபிஐ-களைப் பயன்படுத்த விரும்பும் உலகெங்கிலும் உள்ள டெவலப்பர்களுக்கான சில செயல் நுண்ணறிவுகள் இங்கே:

பட அங்கீகார ஏபிஐ-களின் எதிர்காலம்

பட அங்கீகார ஏபிஐ-களின் எதிர்காலம் பிரகாசமாக உள்ளது. இயந்திர கற்றல் மாதிரிகள் தொடர்ந்து மேம்பட்டு, கணினி சக்தி மலிவாக மாறும்போது, இன்னும் அதிநவீன மற்றும் துல்லியமான ஏபிஐ-கள் வெளிவரும் என்று எதிர்பார்க்கலாம். கவனிக்க வேண்டிய சில போக்குகள் இங்கே:

முடிவுரை

பட அங்கீகார ஏபிஐ-கள் நாம் நம்மைச் சுற்றியுள்ள உலகத்துடன் தொடர்பு கொள்ளும் முறையை மாற்றியமைக்கின்றன. கணினிப் பார்வையின் சக்தியைப் பயன்படுத்த ஒரு எளிய மற்றும் திறமையான வழியை வழங்குவதன் மூலம், இந்த ஏபிஐ-கள் டெவலப்பர்களுக்கு நிஜ உலகப் பிரச்சினைகளைத் தீர்க்கும் புதுமையான பயன்பாடுகளை உருவாக்க உதவுகின்றன. நீங்கள் ஒரு இ-காமர்ஸ் வலைத்தளத்தை, ஒரு சுகாதாரப் பயன்பாட்டை அல்லது ஒரு பாதுகாப்பு அமைப்பை உருவாக்குகிறீர்களானாலும், பட அங்கீகார ஏபிஐ-கள் காட்சித் தரவின் சக்தியைத் திறக்க உங்களுக்கு உதவும். தொழில்நுட்பம் தொடர்ந்து বিকশিতವಾಗும்போது, வரும் ஆண்டுகளில் இன்னும் அற்புதமான பயன்பாடுகள் வெளிவரும் என்று எதிர்பார்க்கலாம். இந்தத் தொழில்நுட்பங்களைத் தழுவி, அவற்றின் திறனைப் புரிந்துகொள்வது, புதுமையின் எதிர்காலத்தை வழிநடத்துவதில் வணிகங்களுக்கும் தனிநபர்களுக்கும் ஒரே மாதிரியாக முக்கியமானதாக இருக்கும்.