Jak korzystać z klucza API Google Gemini? Zawiera przykładowy samouczek AI, nauczanie i szkolenia

Klucze API Google Gemini, koniec zmartwień! Wykonaj to w ciągu jednej minuty i pożegnaj się ze zmartwieniami! ✌✌✌

Szczegółowe tutoriale nauczą Cię krok po kroku, a nawet nowicjusz może zostać mistrzem w ciągu kilku sekund!

Pożegnaj się z uciążliwymi krokami i zrób to z łatwościąAIArtefakt! Dołącz do mnie, aby odblokować nowy świat sztucznej inteligencji!

Jak korzystać z klucza API Google Gemini? Zawiera przykładowy samouczek AI, nauczanie i szkolenia

Po pojawieniu się sztucznej inteligencji Gemini firmy Google, firma Google udostępniła interfejs API do swojego modelu Gemini. Teraz Google zapewnia dostęp API do Gemini Pro, w tym do modeli tekstowych i modeli tekstowo-wizualnych. To godna uwagi premiera, ponieważ do tej pory Google nie dodał możliwości wizualnych do Barda, który obsługuje model tekstowy. Dzięki temu kluczowi API możesz w końcu przetestować multimodalne możliwości Gemini na swoim komputerze lokalnym. W tym przewodniku dowiemy się, jak uzyskać dostęp do interfejsu API Gemini i z niego korzystać.

Uwaga:Klucz API Google Gemini jest obecnie bezpłatny zarówno dla modeli tekstowych, jak i wizualnych. Będzie bezpłatna do czasu, aż stanie się ogólnie dostępna na początku przyszłego roku. Dzięki temu możesz wysyłać do 60 żądań na minutę bez konieczności konfigurowania rozliczeń Google Cloud i ponoszenia jakichkolwiek opłat.

Skonfiguruj Python i Pip na swoim komputerze

Przejdź do naszego przewodnika na komputerze PC lub MacZainstaluj Pythona i Pipa. Potrzebujesz zainstalowanego języka Python 3.9 lub nowszego.

Jeśli używasz Linux systemu, możesz skorzystać z naszego samouczkaZainstaluj Python i Pip na Ubuntu lub innych dystrybucjach.

Możesz uruchomić następujące polecenie w terminaluPotwierdź Python i Pip jest zainstalowany na Twoim komputerze. Zwraca numer wersji.

python -V
pip -V

Sprawdź, czy Python i Pip są zainstalowane Rysunek 2

Po pomyślnej instalacji uruchom poniższe polecenie, aby zainstalować zależności Google Geneative AI.

pip install -q -U google-generativeai

Instalowanie generatywnych zależności AI firmy Google, część 3

Jak zdobyć klucz API Gemini Pro?

Następnie odwiedź makerssuite.google.com/app/apikey i zaloguj się na swoje konto Google.

W obszarze Klucze API kliknijUtwórz klucz API w nowym projekcie" przycisk.

Zdobądź klucz API Gemini Pro 4

Skopiuj klucz API i przechowuj go w bezpiecznym miejscu. Nigdy nie upubliczniaj ani nie udostępniaj kluczy API.

Skopiuj klucz API i zapisz piąty

Jak korzystać z klucza API Gemini Pro (tryb zwykłego tekstu)?

Podobnie jak OpenAI, Google również używa kluczy Gemini API bezpośrednio do celów programistycznych i testowych. Napisałem kod dość prosty, aby zwykli użytkownicy mogli go łatwo przetestować i używać. W tym przykładzie pokażę, jak używać kluczy API w modelach tekstowych Gemini Pro.

Najpierw uruchom swój ulubiony edytor kodu. Jeśli jesteś nowy, po prostu zainstaluj Notepad + +. Dla zaawansowanych użytkowników Visual Studio Code jest doskonałym narzędziem.

Następnie skopiuj i wklej poniższy kod do edytora kodu.

import google.generativeai as genai
genai.configure(api_key='PASTE YOUR API KEY HERE')
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("What is the meaning of life?")
print(response.text)

W edytorze kodu wklej klucz API Gemini. Jak widać, zdefiniowaliśmy model „gemini-pro”, który jest modelem zwykłego tekstu. Dodatkowo dodaliśmy zapytanie, w którym możesz zadawać pytania.

Zdjęcie modelu „gemini-pro” 6

Teraz zapisz kod i nadaj plikowi nazwę. Pamiętaj, aby dodać na końcu .py. Nazwałem plik gemini.pyi zapisz go na pulpicie.

Nazwij plik gemini.py Rysunek 7

Następnie otwórz terminal i uruchom następujące polecenie, aby przejść na pulpit.

cd Desktop

Po wejściu do terminala na pulpicie po prostu uruchom następujące polecenie, aby wykonać je za pomocą języka Python gemini.py plik.

python gemini.py

Użyj Pythona do wykonania pliku gemini.py Zdjęcie 8

Teraz odpowie na Twoje pytanie gemini.py Problemy ustawione w pliku.

Odpowiedz na pytanie zadane w pliku gemini.py Zdjęcie 9

Możesz zmodyfikować pytanie w edytorze kodu, zapisać je i uruchomić ponownie gemini.py plik, aby uzyskać nowe odpowiedzi w terminalu. W ten sposób używasz klucza API Google Gemini, aby uzyskać dostęp do modelu Gemini Pro obsługującego wyłącznie tekst.

Użyj klucza API Google Gemini, aby uzyskać dostęp do modelu Gemini Pro nr 10 w postaci zwykłego tekstu

Jak korzystać z kluczy API Gemini Pro (modele tekstowe i wizualne)

W tym przykładzie pokażę, jak współpracować z multimodalnym modelem Gemini Pro. Nie jest jeszcze dostępny w Google Bard, ale dzięki API możesz uzyskać do niego natychmiastowy dostęp. Na szczęście proces ten jest również bardzo łatwy i bezproblemowy.

Otwórz nowy plik w edytorze kodu i wklej poniższy kod.

import google.generativeai as genai
import PIL.Image
img = PIL.Image.open('image.jpg')
genai.configure(api_key='PASTE YOUR API KEY HERE')
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(["what is the total calorie count?", img])
print(response.text)

Pamiętaj, aby wkleić klucz API Gemini. Tutaj używamy gemini-pro-vision model, który jest modelem tekstowym i wizualnym.

zdjęcie modelu gemini-pro-vision 11

Teraz zapisz plik na pulpicie i dodaj po nazwie pliku .py. Nazwę to tutaj geminiv.py .

Nazwij go geminiv.py Zdjęcie 12

W trzeciej linijce kodu, jak widać, kieruję sztuczną inteligencję na image.jpg plików, nazwy plików są dokładnie takie same. Niezależnie od obrazu, z którym pracujesz, upewnij się, że jest on zapisany geminiv.py Pliki znajdują się w tej samej lokalizacji i mają tę samą nazwę i prawidłowe rozszerzenie. Możesz przekazywać lokalne pliki JPG i PNG o rozmiarze do 4 MB.

Skieruj AI na plik image.jpg zapisany na moim pulpicie Obraz 13

W szóstej linijce kodu możesz zadawać pytania związane z obrazkiem. Ponieważ wprowadzałem obraz związany z jedzeniem, poprosiłem Gemini Pro o obliczenie całkowitej liczby kalorii.

Teraz czas na uruchomienie kodu w terminalu. Po prostu przejdź na pulpit (w moim przypadku) i uruchom kolejno poniższe polecenia. Jeśli dokonasz jakichkolwiek zmian, pamiętaj o zapisaniu pliku.

cd Desktop
python geminiv.py
geminiv.py nr 14

Modele wizualne Gemini Pro bezpośrednio odpowiadają na pytania. Możesz zadać dalsze pytania i poprosić sztuczną inteligencję o wyjaśnienie dlaczego.

Model wizualny Gemini Pro bezpośrednio odpowie na pytanie 15

Możesz także wprowadzić inny obraz, ale upewnij się, że pasuje do nazwy pliku obrazu, zmień pytanie w kodzie i uruchom ponownie geminiv.py plik, aby uzyskać nową odpowiedź.

Jak używać klucza API Gemini Pro w formacie czatu?

Dzięki zwięzłemu kodowi unconv możesz rozmawiać z modelem Gemini Pro za pomocą klucza API Gemini AI w oknie terminala. Dzięki temu nie będziesz musiał zmieniać problemu w kodzie ani ponownie uruchamiać pliku Pythona, aby uzyskać nowe dane wyjściowe. Możesz kontynuować rozmowę w oknie terminala.

A co najważniejsze, Google natywnie implementuje historię czatów, więc nie musisz ręcznie dodawać odpowiedzi ani zarządzać historią czatów w tablicach lub listach. Dzięki prostej funkcji Google może przechowywać całą historię rozmów w sesji czatu. Konkretne operacje są następujące:

Otwórz edytor kodu i wklej poniższy kod.

import google.generativeai as genai
genai.configure(api_key='PASTE YOUR API KEY HERE')
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat()
while True:
message = input("You: ")
response = chat.send_message(message)
print("Gemini: " + response.text)

Jak zwykle skopiuj i wklej klucz podobny do powyższego API.

Rozmowa z kluczem API Gemini Pro Zdjęcie 16

W tym momencie zapisz plik na pulpicie lub w innej lokalizacji. Pamiętaj, aby dodać na końcu .py. Nazwałem to geminichat.py plik.

Plik o nazwie geminichat.py nr 17

Teraz otwórz terminal i przejdź na pulpit. Dalej biegnij geminichat.py plik.

cd Desktop
python geminichat.py

Uruchom obraz pliku geminichat.py 18

Teraz możesz łatwo kontynuować rozmowę, a historia Twoich rozmów zostanie zapamiętana. Istnieje więc kolejny świetny sposób wykorzystania kluczy API Google Gemini.

gemini pro api odpowiada na czacie terminala, na obrazku 19

To tylko kilka przykładów tego, co możesz zrobić z Google Gemini poprzez API. Cieszę się, że Google udostępnia swój model wizji entuzjastom i programistom oraz łączy go z DALL-E 3 i ChatGPT Porównywać. Choć model wizualny Gemini Pro nie jest tak dobry jak model GPT-4V, to i tak jest całkiem nieźle. Z niecierpliwością czekamy na premierę Gemini Ultra, który będzie porównywalny z modelem GPT-4.

Poza tym interfejs API Gemini Pro reaguje inaczej niż Google Bard, który również działa na ulepszonej wersji Gemini Pro. Odpowiedzi Barda wydawały się nieco nijakie, ale odpowiedzi API Gemini Pro były bardziej żywe i charakterystyczne.

Będziemy uważnie śledzić wszelkie zmiany w tym obszarze, więc bądź na bieżąco, aby uzyskać więcej informacji na temat Gemini AI. W międzyczasie możesz także samodzielnie sprawdzić Google Gemini API.

发表 评论

Twój adres e-mail nie zostanie opublikowany. 必填 项 已 用 * 标注

Przewiń do góry