vision-api

An innovative AI conversation API leveraging Google's Gemini for multimodal understanding. Combines FastAPI, Langchain, and Redis for robust, scalable, and privacy-conscious text and image-based interactions

python gemini vision-api gemini-api fastapi large-language-models langchain langchain-python google-generative-ai google-gemini gemini-pro-vision gemini-pro gemini-ai gemini-pro-api gemini-pro-bot

Updated May 20, 2024
Python

gabrieltanhl / OCR-Telegram-Bot

Star

A simple Telegram bot that performs OCR on images you send to it

telegram-bot vision-api telegram-python-bot

Updated Dec 8, 2022
Python

AI-Unleashed / GPT4o_Vision

Star

Starter code for using GPT4o to extract text from an image

vision-api gpt4o

Updated May 26, 2024
Python

ghostofpokemon / oCaption

Star

oCaption: Leveraging OpenAI's GPT-4 Vision for Advanced Image Captioning

vision openai gpt captioning-images vision-api blip caption-generation openai-api sdxl

Updated Nov 20, 2023
Python

boudhayan-dev / Automatic-Parking-System

Star

An automatic parking system solution for the modern work spaces.

python google-cloud-platform thingspeak raspberry-pi-3 vision-api ocr-recognition mit-appinventor

Updated Jun 21, 2018
Python

boudhayan-dev / Blind-Reader-project

Star

A low cost reading device for blind people.

text-to-speech ocr google-cloud python3 pygame raspberry-pi-3 vision-api

Updated Jun 7, 2019
Python

Xevion / phototag

Sponsor

Star

Rich tagging in the Terminal via Google Vision API

python metadata label jpeg python3 iptc click python-click labeling google-vision-api raw vision-api raw-image iptc-metadata photo-tagging

Updated May 12, 2023
Python

MainakVerse / Handwriting-To-Text

Star

Convert the most illegible handwriting to comfortably readable text

deep-learning neural-network text conversion optical-character-recognition handwriting-recognition vision-api vision-transformer

Updated Feb 21, 2025
Python

GINK03 / keras-distillation

Star

keras google-vision's distillation

keras vision-api tensorflow-basics keras-distillation

Updated Nov 12, 2017
Python

anthonyjdella / summarize-text

Sponsor

Star

📖 A Python app that uses text recognition on photos, then texts you a summary.

python twilio openai text-recognition vision-api

Updated Mar 13, 2023
Python

hwasiti / smart-image-scraper

Star

Deep learning-based image dataset cleaning of Flickr. Scraped metadata saved in MongoDB. Web app designed & deployed: https://bit.ly/smart_image_scraper

deep-learning flickr-api scraped-data vision-api exif-data

Updated Mar 24, 2023
Python

ScottStevenWhite / DocsInARow

Star

"Docs in a Row" is an automated script designed to handle image data extraction, correction, categorization, and storage. It utilizes a variety of technologies including OpenAI, Google Cloud Vision, pytesseract, and PIL to extract and correct text from images, categorize the content, and store useful metadata.

openai vision-api good-first-issue pytesseract-ocr openai-api