Logo Tyfloświat

Co to są klucze API? Dlaczego warto z nich korzystać i poświęcić chwilę na ich konfigurację? Jak je poprawnie ustawić, aby działały zgodnie z naszymi oczekiwaniami? W tym artykule postaram się wyjaśnić to wszystko w możliwie najprostszy i najbardziej przystępny sposób.

Nigdy wcześniej się nimi nie interesowałam. Wystarczała mi sama świadomość ich istnienia i nie czułam potrzeby, by zagłębiać się w ten temat. Wszystko zmieniło się w momencie, gdy zainstalowałam aplikację umożliwiającą transkrypcję tekstu. Okazało się, że można w niej skonfigurować dodatkowe funkcje, a dostęp do nich otwierały właśnie klucze API. I tak rozpoczęła się moja przygoda z tym rozwiązaniem. Owszem, wcześniej próbowałam czytać różne wyjaśnienia dotyczące kluczy API, ale wiele z nich było napisanych zbyt technicznym językiem. Brakowało mi artykułu, który tłumaczyłby to w prosty, zrozumiały sposób — bez skomplikowanych pojęć i niezrozumiałego żargonu. Dlatego postanowiłam opisać wszystko po swojemu — tak, jak sama chciałabym kiedyś o tym przeczytać.

Czym są klucze API i do czego mogą się przydać

Klucz API to swego rodzaju most pomiędzy naszą aplikacją a funkcjami udostępnianymi przez innego dewelopera lub usługę. Wyobraźmy sobie, że siedzimy w restauracji. Między naszym stolikiem a kuchnią porusza się kelner, który obsługuje zamówienia. To właśnie on będzie w tym przykładzie odpowiednikiem klucza API.

Mówimy kelnerowi, co chcemy zjeść, a on przynosi nam odpowiednie dania. Nie poznajemy jednak sekretów kuchni ani przepisów na konkretne potrawy — otrzymujemy jedynie gotowy efekt. Podobnie działa klucz API. Dzięki niemu możemy korzystać z funkcji innych usług bez konieczności poznawania ich wewnętrznego działania.

I tak, możemy uzyskać dostęp do konkretnych modeli sztucznej inteligencji i wykorzystywać ich możliwości we własnej aplikacji. Jeśli jesteśmy programistami, taki klucz API może posłużyć do połączenia naszego kodu z funkcjami, jakie oferuje na przykład ChatGPT.

Warto też pamiętać, że klucze API nie służą wyłącznie do obsługi sztucznej inteligencji. Dobrym przykładem jest choćby DeepL. Za pomocą jego klucza API można zintegrować funkcje tłumaczenia z własną aplikacją lub projektem.

Klucz API daje więc nam dostęp do funkcji innych usług i aplikacji. Mogą to być między innymi tłumaczenia, transkrypcje tekstu, generowanie treści czy wiele innych możliwości.

Gdzie możemy uzyskać klucze API

Klucz API możemy uzyskać bezpośrednio od dewelopera lub firmy oferującej określone usługi czy funkcje. Takie klucze bywają dostępne zarówno za darmo, jak i wyłącznie w płatnej formie. Jeśli deweloper udostępnia bezpłatny dostęp, zazwyczaj wiąże się on z określonymi limitami.

Np. korzystając z klucza API od ElevenLabs, możemy transkrybować lub generować określoną ilość treści w ramach darmowego limitu zapytań, po którego zużyciu konieczne jest wykupienie dodatkowego pakietu lub przejście na płatny plan.

Nieco inaczej wygląda sytuacja w przypadku niektórych usług, takich jak OpenAI. Aby korzystać z ich API, należy najpierw doładować konto określoną kwotą, podpinając kartę płatniczą. Następnie opłaty są naliczane zależnie od rzeczywistego wykorzystania usługi.

Każde nasze polecenie, czyli tak zwany prompt, zużywa określoną liczbę tokenów. Tokeny można porównać do jednostek rozliczeniowych — im bardziej złożone lub dłuższe zapytanie oraz odpowiedź, tym większe może być ich zużycie. Ostatecznie liczba wykorzystanych tokenów przekłada się na konkretny koszt.

Dlaczego warto posiadać kilka różnych kluczy API? Przede wszystkim dlatego, że różni dostawcy oferują odmienne możliwości. Jeden klucz może zapewniać dostęp do tłumaczeń, inny do transkrypcji, a jeszcze inny do modeli sztucznej inteligencji czy generowania głosu. Korzystając z kilku usług jednocześnie, zyskujemy większą elastyczność i możemy dopasować narzędzia do własnych potrzeb.

Dodatkowo wiele aplikacji pozwala użytkownikowi wprowadzić własny klucz API, dzięki czemu można korzystać z wybranych usług bezpośrednio w danym programie. Przykładami takich aplikacji są między innymi MacWhisper oraz VO OCR.

przejdźmy teraz do tego, jak uzyskać klucze API u poszczególnych dostawców. Skupię się na konkretnych usługach, takich jak ElevenLabs, OpenAI oraz Gemini.

ElevenLabs

Klucz API od ElevenLabs umożliwia między innymi transkrypcję tekstu, choć oczywiście jego możliwości są znacznie większe.

Aby go uzyskać, musimy udać się na stronę: https://elevenlabs.io/. Jeśli nie posiadamy jeszcze konta, konieczna będzie rejestracja. Konto jest wymagane do utworzenia klucza API.

Gdy jesteśmy już zalogowani, możemy przejść do wygenerowania własnego klucza API. W tym celu klikamy w łącze „Deweloperzy”, a następnie wybieramy opcję „Klucze API”.

Kolejny krok to wybór przycisku „Utwórz klucz”. Następnie należy nadać nazwę swojemu kluczowi. Może to być na przykład „Transkrypcja tekstu” albo nazwa aplikacji, w której planujemy go używać.

Teraz możemy określić, do jakich działań ma być wykorzystywany klucz API. Jeśli jednak nie chcemy nakładać żadnych ograniczeń, wystarczy wyłączyć opcję „Ogranicz klucz”.

Gdy wszystko będzie już ustawione, wybieramy opcję „Utwórz klucz”. Ostatnim krokiem jest kliknięcie opcji „Kopiuj do schowka”.

To bardzo ważne, aby od razu skopiować klucz i zapisać go w bezpiecznym miejscu. Po zamknięciu tego okna nie będzie już możliwości ponownego wyświetlenia pełnej wartości klucza, nawet z poziomu strony. Jeśli nie zachowacie swojego klucza i utracicie do niego dostęp, konieczne będzie usunięcie obecnego oraz wygenerowanie nowego.

Warto pamiętać, że klucza API nie powinno się udostępniać publicznie ani przesyłać przypadkowym osobom. Są one przypisane do naszego konta i mogą umożliwiać dostęp do opłacanych przez nas usług. Jeśli ktoś uzyska do niego dostęp, może bez naszej wiedzy zużywać dostępne środki lub limity API.

Klucz API w darmowej wersji umożliwia obecnie transkrypcję około 2,5 godziny nagrań miesięcznie, jeśli nie korzystamy z rozpoznawania mówców. Natomiast gdy chcemy, aby model rozróżniał poszczególnych rozmówców w naszych nagraniach, limit ten spada do około 2 godzin.

Jeśli wykorzystamy cały dostępny limit, musimy poczekać do kolejnego okresu rozliczeniowego na jego odnowienie lub wykupić płatny plan, aby zwiększyć dostępne możliwości i znieść część ograniczeń.

Osobiście nigdy z tego nie korzystałam, dlatego nie będę szczegółowo omawiać, jak dokładnie wygląda to w przypadku płatnych opcji dla klucza API od ElevenLabs.

OpenAI

Ten klucz API umożliwia korzystanie z wielu funkcji oferowanych przez modele OpenAI. Pozwala między innymi na transkrypcję tekstu, streszczanie transkrypcji czy nawet sterowanie komputerem w wybranych aplikacjach wykorzystujących taką możliwość.

Aby utworzyć klucz, udajemy się na stronę:
https://platform.openai.com/settings/organization/api-keys

Aby utworzyć klucz API, należy być zalogowanym na swoje konto. Gdy już jesteśmy, klikamy przycisk „Create new secret key”. Następnie wybieramy właściciela klucza. W tym przypadku będzie to opcja „You”, czyli ty. Domyślnie powinna być już zaznaczona.

Kolejnym krokiem jest nadanie nazwy kluczowi — podobnie jak miało to miejsce w przypadku ElevenLabs. Następnie musimy określić uprawnienia, jakie będzie posiadał klucz, czyli zdecydować, z których funkcji będzie można korzystać za jego pomocą.

Domyślnie zaznaczona jest opcja „All”, czyli wszystkie uprawnienia. Jeśli chcemy, możemy to zmienić, choć osobiście tego nie polecam. Pozostawienie pełnych uprawnień sprawia, że klucz będzie można łatwiej wykorzystać w różnych aplikacjach, bez dodatkowych ograniczeń funkcjonalności.

Na końcu pozostaje już tylko kliknięcie przycisku „Create secret key”, czyli utwórz sekretny klucz.

Tak jak wcześniej, bardzo ważne jest, aby od razu skopiować wygenerowany klucz do schowka i zapisać go w bezpiecznym miejscu. Po zamknięciu okna nie będzie już możliwości ponownego wyświetlenia pełnej wartości klucza.

Gdy mamy już utworzony klucz, kolejnym krokiem jest podpięcie do konta karty płatniczej, aby móc zasilić saldo. Obecnie konieczne jest doładowanie konta kwotą co najmniej 5 dolarów, aby aktywować możliwość korzystania z API. Bez dostępnych środków na koncie klucz nie będzie działał, przez co nie będzie można używać go w aplikacjach wymagających dostępu do API OpenAI.

Aby dodać kartę płatniczą, przechodzimy na stronę:
https://platform.openai.com/settings/organization/billing/overview

Następnie klikamy opcję „Payment methods Add or change payment method”. Dalej wystarczy wykonywać kolejne kroki zgodnie z instrukcjami wyświetlanymi na stronie. Dodajemy kartę płatniczą i za jej pomocą zasilamy konto.

W chwili pisania tego artykułu minimalna kwota doładowania wynosi 5 dolarów, jednak warto pamiętać, że zasady oraz minimalne wpłaty mogą zmieniać się z czasem.

Gemini

Podobnie jak w przypadku klucza od OpenAI, Gemini również daje nam dostęp do wielu możliwości. Sam proces jego tworzenia jest także bardzo zbliżony do generowania wcześniej omawianych kluczy.

Aby utworzyć klucz, przechodzimy na stronę:
https://aistudio.google.com/

Następnie poruszamy się po nagłówkach, aż dotrzemy do nagłówka „Start building with Gemini API”. Kolejno przesuwamy się w prawo i klikamy opcję:
„Get an API key Manage API keys and monitor resource usage in one place Start”, czyli „Zdobądź klucz API, zarządzaj kluczami API i monitoruj wykorzystanie zasobów w jednym miejscu”.

Tutaj bardzo ważna kwestia — musimy być zweryfikowanymi użytkownikami pod kątem wieku. Jeśli nie jesteśmy, Google może wymagać potwierdzenia wieku. Bez tego utworzenie klucza API nie będzie możliwe.

Jeśli taka sytuacja będzie miała miejsce, wyświetli Wam się następujący komunikat:

„Jeśli ta strona wyświetliła się podczas próby uzyskania dostępu do Google AI Studio, może to być spowodowane jedną z tych przyczyn:
• Ograniczenia regionalne: Google AI Studio nie jest dostępne w Twoim regionie. Listę obsługiwanych regionów znajdziesz w sekcji poniżej.
• Wymagania dotyczące wieku: nie spełniasz minimalnego wymagania dotyczącego wieku (18 lat), aby uzyskać dostęp do tej usługi.
• Potwierdzenie własności konta: możesz mieć dostęp do usługi, ale nie zweryfikowano jeszcze Twojego wieku na koncie Google.
Więcej informacji o wymaganiach znajdziesz w Warunkach korzystania z usługi”.

Natomiast jeśli wszystko będzie w porządku, będziecie mogli przejść do tworzenia klucza API.

Zakładając, że spełniamy wszystkie wymagania, klikamy przycisk „Create API key”. Następnie nadajemy nazwę swojemu kluczowi i klikamy przycisk służący do jego wygenerowania:
„Create key Press space for more information.”.

Po wygenerowaniu klucza ponownie klikamy przycisk, który umożliwia skopiowanie go do schowka. Tak jak w przypadku wcześniej omawianych usług, bardzo ważne jest zapisanie klucza w bezpiecznym miejscu, ponieważ później nie będzie już możliwości ponownego wyświetlenia jego pełnej wartości z poziomu strony.

Aby doładować nasze konto, przechodzimy do podstrony „Billing”. Gdy tam wejdziemy, zobaczymy komunikat o następującej treści:

„Set up billing and make prepayment to access higher rate limits, advanced features, exclusive models, and more.”

Komunikat ten oznacza:

„Skonfiguruj płatności i dokonaj przedpłaty, aby uzyskać dostęp do wyższych limitów wykorzystania, zaawansowanych funkcji, ekskluzywnych modeli i innych możliwości.”

Pod komunikatem znajduje się przycisk, który musimy kliknąć, aby skonfigurować płatności:

„Set up billing Press space for more information.”

Przycisk ten przeniesie nas do strony, na której będziemy musieli wybrać projekt, do którego przypisany jest nasz klucz API. Jeśli nic wcześniej nie zmienialiście, projekt powinien mieć nazwę podobną do:

„Default Gemini Project”.

Gdy wybierzemy go z listy, klikamy przycisk „Set up billing”, czyli „Skonfiguruj płatności”.

W kolejnym kroku będziemy akceptować warunki korzystania, klikając przycisk:

„Agree & continue”, czyli „Zgadzam się i kontynuuję”.

Dalej postępujemy już zgodnie z instrukcjami wyświetlanymi na ekranie.

Wygenerowane klucze i co dalej

 

Skoro mamy już gotowe do działania klucze API, możemy wreszcie przejść do korzystania z ich możliwości. Opiszę teraz, jak używać ich w poszczególnych aplikacjach oraz jak je skonfigurować, aby działały poprawnie po integracji z wybranym programem-usługą.

Pokażę to na przykładzie aplikacji VO OCR oraz MacWhisper — zarówno w wersji na Maca, jak i na iPhone’a.

Aplikacja VO OCR

W aplikacji VO OCR klucz API daje nam możliwość rozpoznawania przycisków oraz analizowania obrazów za pomocą wybranego modelu sztucznej inteligencji i przypisanego do niego klucza API. Umożliwia również sterowanie komputerem. Aby jednak te funkcje mogły działać, najpierw musimy dodać odpowiedni klucz do programu.

W tym celu otwieramy aplikację VO OCR. Następnie, za pomocą skrótu VO + M + M, przechodzimy do paska statusu i poruszając się w prawo lub lewo, odnajdujemy aplikację VO OCR.

Gdy ustawimy na niej kursor VO, naciskamy VO + spację, a następnie z menu, które się otworzy, wybieramy „Presety”, podmenu rozwijane za pomocą strzałki w prawo i wybieramy „Menedżer presetów…”. Po wejściu do menedżera możemy dodać nowy preset lub edytować już istniejący.

Jeśli chcemy zmodyfikować domyślny preset, wybieramy go z tabeli i klikamy opcję „Edytuj”.

Natomiast jeśli chcemy utworzyć nowy preset od podstaw, klikamy przycisk „Dodaj”. Podczas tworzenia nowego presetu musimy nadać mu nazwę. Może to być na przykład nazwa modelu sztucznej inteligencji, z którego zamierzamy korzystać.

Następnie możemy wprowadzić nasz klucz API. Kolejnym krokiem jest wybór modelu, którego chcemy używać, na przykład ChatGPT 5.4.

Później możemy ustawić domyślny prompt, z którego model sztucznej inteligencji będzie korzystał podczas działania.

Gdy wszystko będzie już skonfigurowane, klikamy przycisk „Zapisz”.

Od tej chwili możemy korzystać zarówno z możliwości oferowanych przez aplikację VO OCR, jak i funkcji udostępnianych przez wybrany model sztucznej inteligencji.

MacWhisper

 

Aplikacja MacWhisper oferuje między innymi takie funkcje jak transkrypcja tekstu, tworzenie streszczeń transkrypcji za pomocą ChatGPT oraz możliwość zadawania pytań dotyczących wcześniej wykonanej transkrypcji. MacWhispera opisywał szerzej na łamach Tyfloświata Piotr Machacz.

Aby skonfigurować klucz API, musimy przejść do ustawień aplikacji za pomocą skrótu cmd + , . Po otwarciu ustawień z paska bocznego wybieramy opcję „Services”, która znajduje się tuż pod nagłówkiem „AI”. Następnie z tzw. siatki wybieramy „OpenAI”, po czym wprowadzamy klucz API i wybieramy model GPT, z którego chcemy korzystać.

Jeśli natomiast chcemy dodać klucz od ElevenLabs, przechodzimy do ustawień aplikacji, następnie do sekcji „Cloud Models”, a tam przy ElevenLabs wybieramy przycisk „Configure”. Kolejno wprowadzamy nasz klucz API i zatwierdzamy go przyciskiem „Done”, czyli „Gotowe”.

W podobny sposób można skonfigurować również klucz API od OpenAI.

I to właściwie wszystko — od tej chwili możemy korzystać z pełni możliwości, jakie oferują klucze API w tej aplikacji na Macu.

MacWhisper IOS

To nie wszystko, jeżeli mamy na myśli MacWhispera. Okazuje się, że istnieje również jego wersja na iPhone’y i iPady.

Jeżeli chcielibyśmy dodać klucz jednej z usług do dyktowania za pomocą sztucznej inteligencji, przechodzimy do ustawień, które czytnik ekranu oznajmia jako „gearshape”. Następnie wybieramy opcję „Custom API Keys” i wprowadzamy nasze klucze do OpenAI oraz ElevenLabs.

Po wykonaniu tych kroków wracamy do poprzedniego ekranu i od tej chwili możemy już korzystać z funkcji udostępnianych przez integrację kluczy API z aplikacją.

Whisper Dictation wyróżnia się bardzo wysoką dokładnością rozpoznawania mowy. Dzięki wykorzystaniu modeli sztucznej inteligencji, takich jak modele od ElevenLabs, dyktowany tekst jest przetwarzany niezwykle precyzyjnie, a zamiana mowy na tekst często okazuje się skuteczniejsza niż w przypadku standardowego dyktowania systemowego.

Podsumowanie

Uważam, że warto skonfigurować własne klucze API, ponieważ potrafią one znacząco rozszerzyć możliwości naszych aplikacji i odblokować funkcje, które często nie są dostępne w standardowej wersji programu.

Na początku cały proces może wydawać się skomplikowany, a nawet przytłaczający. W praktyce jednak po utworzeniu pierwszego klucza API generowanie i konfigurowanie kolejnych staje się znacznie prostsze. W większości przypadków wygląda to bardzo podobnie, a różnice pomiędzy poszczególnymi usługami są zazwyczaj niewielkie.

Największym wyzwaniem bywa zwykle dodanie karty płatniczej oraz pierwsze zasilenie konta. Gdy jednak przejdziemy przez ten etap, dalsze korzystanie z kluczy API staje się dużo łatwiejsze i najczęściej nie wymaga już ponownej konfiguracji.

Mam nadzieję, że ten artykuł pomógł Wam lepiej zrozumieć, czym są klucze API, do czego mogą się przydać oraz jak rozpocząć korzystanie z nich w różnych aplikacjach.

 

Partnerzy

 Fundacja Instytut Rozwoju Regionalnego                     Państwowy Fundusz Rehabilitacji Osób Niepełnosprawnych

Back to top