Ogłoszenie nr 2022-12358-110251
Moduł ekstrakcji jednostek nazewniczych w języku angielskim, niemieckim oraz hiszpańskim - zapytanie ofertowe 4/2022
Status ogłoszenia: Rozstrzygnięte
Termin składania ofert
2022-05-30
Data opublikowania ogłoszenia
2022-05-23
Data ostatniej zmiany
2022-05-24
Planowany termin podpisania umowy
2022-06
Powstaje w kontekście projektu
POIR.01.01.01-00-0923/20 - SentiDeepFusion: zastosowanie uczenia głębokiego w celu automatyzacji wielojęzycznej ekstrakcji informacji z tekstów potocznych dla interfejsów konwersacyjnych i analityki doświadczeń klienta
Warunki zmiany umowy
Zamawiający zastrzega sobie możliwość zmiany zakresu umowy zawartej z podmiotem wybranym w wyniku przeprowadzonego postępowania o udzielenie zamówienia, a w szczególności z następujących powodów: - Okoliczności siły wyższej, - Zmian regulacji prawnych obowiązujących w dniu podpisania umowy, - Wprowadzenie przez Instytucję Pośredniczącą dodatkowych wymagań odnośnie parametrów oprogramowania lub kamieni milowych - Otrzymania decyzji jednostki finansującej projekt, zawierającej zmiany zakresu zadań, terminów realizacji czy też ustalającej dodatkowe postanowienia w zakresie prac objętych tym projektem, do przyjęcia których Zamawiający zostanie zobowiązany pod rygorem odmowy udzielenia lub kontynuowania finansowania; - Innych niezbędnych dla udzielenia lub kontynuowania finansowania projektu. - Zmiana harmonogramu realizacji Zlecenia - Dodanie parametrów rezultatów zadań lub oprogramowania doprecyzowujących przedmiot Zlecenia, którego celem jest wykonanie prac zgodnie z wnioskiem o dofinansowanie.
Załączniki
Dodane do ogłoszenia w wersji 1 z dn. 2022-05-23
1. Zaproszenie do składania ofert nr 4_2022
2. Załącznik nr 1 do Zapytania Ofertowego nr 4_2022 - Formularz ofertowy
3. Załącznik nr 2 do zapytania ofertowego - Oświadczenie o braku powiązań
4. Załącznik nr 3 do zapytania ofertowego - Oświadczenie o spełnieniu warunków
Części zamówienia
Część 1
Moduł ekstrakcji jednostek nazewniczych
Budżet
350000,00 PLNCzy dopuszczalne oferty wariantowe
NIE
Przedmioty zamówienia
Opis
Podmiot realizuje projekt pod nazwą “SentiDeepFusion: zastosowanie uczenia głębokiego w celu automatyzacji wielojęzycznej ekstrakcji informacji z tekstów potocznych dla interfejsów konwersacyjnych i analityki doświadczeń klienta” który jest przedmiotem wniosku o dofinansowanie w ramach Działania 1.1 „Projekty B+R przedsiębiorstw”, Poddziałania 1.1.1 „Badania przemysłowe i prace rozwojowe realizowane przez przedsiębiorstwa” Programu Operacyjnego Inteligentny Rozwój 2014-2020. Zadanie 1 - Moduł ekstrakcji jednostek nazewniczych Opracowanie metody wykrywania i dezambiguacji jednostek nazewniczych w tekstach potocznych i konwersacyjnych w języku angielskim, niemieckim oraz hiszpańskim wraz z opracowaniem modułu ekstrakcji jednostek nazewniczych w 3 językach - angielskim, niemieckim oraz hiszpańskim. Przedmiotem zamówienia jest opracowanie modułu ekstrakcji jednostek nazewniczych dla tekstów potocznych i konwersacyjnych w 3 językach - angielskim, niemieckim oraz hiszpańskim. Moduł ekstrakcji będzie wykrywał jednostki nazewnicze i dokonywał ich dezambiguacji (dezambiguacja jednostek nazewniczych, ang. named entity disambiguation https://en.wikipedia.org/wiki/Entity_linking). Wśród jednostek nazewniczych znajdą się: osoby, organizacje oraz miejsca. Próbka tekstów potocznych i konwersacyjnych zostanie dostarczona przez SentiOne. Dostarczony przez Zamawiającego korpus tekstów potocznych i konwersacyjnych zawierać będzie szeroki przekrój różnego rodzaju treści takich jak: komentarze z serwisu Facebook, treści blogów/artykułów i komentarze pod nimi, treści forów internetowych, treści mikroblogów (Twitter), rozmowy telefoniczne, prywatne konwersacje w kanale tekstowym. Przedstawione źródła będą podzielone na tematyczne dziedziny, np: banki/finanse, zdrowie i treści o produktach farmaceutycznych, sprzedaż i e-commerce, energetyka. Korpus będzie zawierał treści w 3 językach: angielskim, hiszpańskim oraz niemieckim. W ramach zadania zostaną opracowane metody wykrywania i dezambiguacji jednostek nazewniczych tekstów potocznych i konwersacyjnych w 3 językach: angielskim, niemieckim i hiszpańskim. Metody powinny wykorzystywać techniki uczenia maszynowego pozwalające na trenowanie modelu statystycznego na dostarczonym korpusie wzorcowym. Metody mogą korzystać z dodatkowych źródeł danych oraz narzędzi dostępnych na otwartej licencji takich jak tagery morfo-składniowe, wordnety czy słowniki dziedzinowe. Zakres prac: - Opracowanie analizy doboru technologii użytej w projekcie, której celem jest minimalizacja ryzyka technologicznego, maksymalizacja wydajności, skalowalności i skuteczności ostatecznego rozwiązania. - Dostosowanie metody wykrywania jednostek nazewniczych w języku angielskim do przetwarzania tekstów potocznych i konwersacyjnych. - Dostosowanie metody wykrywania jednostek nazewniczych w języku hiszpańskim do przetwarzania tekstów potocznych i konwersacyjnych. - Dostosowanie metody wykrywania jednostek nazewniczych w języku niemieckim do przetwarzania tekstów potocznych i konwersacyjnych. - Dostosowanie metody dezambiguacji jednostek nazewniczych w języku angielskim do przetwarzania tekstów potocznych i konwersacyjnych. - Dostosowanie metody dezambiguacji jednostek nazewniczych w języku hiszpańskim do przetwarzania tekstów potocznych i konwersacyjnych. - Dostosowanie metody dezambiguacji jednostek nazewniczych w języku niemieckim do przetwarzania tekstów potocznych i konwersacyjnych. - Opracowanie modułu ekstrakcji jednostek nazewniczych do przetwarzania języka angielskiego. - Opracowanie modułu ekstrakcji jednostek nazewniczych do przetwarzania języka hiszpańskiego. - Opracowanie modułu ekstrakcji jednostek nazewniczych do przetwarzania języka niemieckiego. - Opracowane rozwiązanie powinno wykazywać 85% skuteczności (obliczanej miarą F1) dla wykrywania oraz 65% skuteczności (obliczanej miarą accuracy) dla dezambiguacji jednostek nazewniczych znajdujących się w próbce tekstów potocznych i konwersacyjnych dostarczonych przez SentiOne. Dopuszczalne jest użycie frameworków, bibliotek lub innych zewnętrznych zasobów o ile będą dostępne na licencji zezwalającej na nieodpłatne użycie w celach komercyjnych przez Zleceniodawcę. Rozwiązanie nie może wymagać zakupu przez Zleceniodawcę dodatkowych licencji. Moduł powinien zostać napisany w języku Scala lub Java, a jego poprawne, stabilne i wydajne uruchomienie musi być możliwe na maszynie wirtualnej Oracle JRE 11 na systemie operacyjnym Linux. Dopuszczalne jest użycie modułów napisanych w innych językach (np. Python, C++), jednak muszą one zostać wyposażone w interfejs w języku Java lub inną formę komunikacji umożliwiającą poprawną, skuteczną, stabilną i wydajną pracę z oprogramowaniem uruchomionym na maszynie wirtualnej Oracle JRE 11 na systemie operacyjnym Linux. Wykonawca musi przekazać Zamawiającemu przedmiot zamówienia w postaci kodu źródłowego wraz z zasobami niezbędnymi do jego prawidłowego działania oraz pełną dokumentacją i instrukcją uruchomienia. Rozwiązanie musi zawierać instrukcje Docker (plik Dockerfile bądź przy większej ilości serwisów docker-compose.yaml) pozwalające zbudować przenaszalny pomiędzy środowiskami kontener (bądź zestaw kontenerów) serwujący cały przedmiot zamówienia. Instrukcje Docker powinny korzystać z silnika Docker Engine w wersji przynajmniej 18.09 a instrukcje Docker Compose powinny być pisane z wykorzystaniem wersji przynajmniej 3. Przedmiot zamówienia obejmuje także udzielenie nieograniczonej czasowo i terytorialnie licencji lub przeniesienie majątkowych praw autorskich do wszystkich utworów stworzonych w związku z wykonywaniem zamówienia na wszystkich polach eksploatacji wymienionych w przepisach ustawy o prawie autorskim i prawach pokrewnych.
Okres gwarancji
12 miesięcy
Kody CPV
72212221-4 Usługi opracowywania oprogramowania do przeszukiwania internetu
72212460-1 Usługi opracowywania oprogramowania analitycznego, naukowego, matematycznego lub prognozującego
Miejsca realizacji
adres
Kraj
Polska
Województwo
pomorskie
Powiat
Gdańsk
Gmina
Gdańsk
Miejscowość
Gdańsk
Warunki, jakie musi spełniać oferent
Typ
Osoby zdolne do wykonania zamówienia
Opis
Zasoby kadrowe: - co najmniej 5 osób posiadających stopień naukowy minimum doktora w przedmiotowym obszarze; - oferent musi wykazać, iż dysponuje zespołem (co najmniej 5 osób) posiadającym udokumentowane kompetencje w co najmniej dwóch ze wskazanych niżej obszarów: - inżynieria języka naturalnego (IJN) - technologia językowa - zastosowania IJN w systemach działających w praktycznej skali - lingwistyka informatyczna - lingwistyka i leksykografia - analiza morfo-syntaktyczna i składniowa - segmentacja tekstu (tokeny, symbole, zdania) - lematyzacja, podział na frazy, ujednoznacznienie - konstrukcja leksykalnych sieci semantycznych, w tym sieci tego typu dla języka angielskiego, niemieckiego, hiszpańskiego Oferent musi wymienić projekty realizowane z firmami w jakich dany pracownik brał udział oraz podać dane kontaktowe do reprezentantów firm w celu weryfikacji i udzielenia referencji. Oferent musi określić poziom językowy pracowników wg Europejskiego Systemu Opisu Kształcenia Językowego. Znajomość języka na danym poziomie musi być udokumentowana np. certyfikatem, do wglądu na prośbę Zamawiającego Oferent powinien przedstawić wraz z ofertą, listę osób zawierającą imię i nazwisko, tytuł naukowy, wskaźnik Hirscha (h-indeks) od 2014 wg portalu Google Scholar, a także listę 5 najważniejszych publikacji z ostatnich 10 lat w wyżej wymienionych obszarach wraz z liczbą cytowań z portalu Google Scholar. Uwzględnione będą tylko publikacje na tematy związane z dziedziną językoznawstwa korpusowego, językoznawstwa komputerowego lub innego typu językoznawstwa lub informatyki, związanego z zastosowaniem ich badań w przetwarzaniu języka naturalnego.
Typ
Wiedza i doświadczenie
Opis
A. Doświadczenie w realizacji prac o charakterze B+R oraz doświadczenie wdrożeniowo - doradcze w obszarze badań operacyjnych lub technologii informacyjnych, w co najmniej dwóch ze wskazanych tematów: -budowy dużych leksykalnych sieci semantycznych typu wordnet dla języka angielskiego, niemieckiego i hiszpańskiego - praktycznych zastosowań metod automatycznego wydobywania zasobów semantyki leksykalnej języka (np. relacji semantycznych i znaczeń leksykalnych) z dużych korpusów tekstów w języku angielskim, niemieckim i hiszpańskim, - zastosowań technologii językowej w systemach przetwarzających teksty w języku angielskim, niemieckim i hiszpańskim. Wykazane doświadczenie powinno być udokumentowane za pomocą publikacji naukowych opublikowanych w recenzowanych czasopismach naukowych. Oferent powinien przedstawić wraz z ofertą listę zawierającą nazwy projektów wraz z krótkim opisem zakresu prac jakie były powierzone Wykonawcy. W przypadku braku możliwości przesłania informacji na temat projektu (np. umowa o poufności), prosimy o ogólne informacje związane z zakresem powierzonym prac. B. Doświadczenie w realizacji prac o charakterze B+R oraz doświadczenie wdrożeniowo - doradcze w obszarze badań operacyjnych lub technologii informacyjnych, w co najmniej dwóch ze wskazanych tematów: - konstrukcja tagerów do ujednoznacznia morfosyntaktycznego dla języka angielskiego, niemieckiego i hiszpańskiego, - praktyczne zastosowanie tagerów w przetwarzaniu dużych kolekcji dokumentów tekstowych, - zastosowań technologii językowej dla języka w systemach przetwarzających teksty w języku angielskim, niemieckim i hiszpańskim. Wykazane doświadczenie powinno być udokumentowane za pomocą publikacji naukowych opublikowanych w recenzowanych czasopismach naukowych. Oferent powinien przedstawić wraz z ofertą listę zawierającą nazwy projektów wraz z krótkim opisem zakresu prac jakie były powierzone Wykonawcy. W przypadku braku możliwości przesłania informacji na temat projektu (np. umowa o poufności), prosimy o ogólne informacje związane z zakresem powierzonym prac. C. Wykonawca powinien mieć przynajmniej trzyletnie udokumentowane doświadczenie w zakresie opracowywania i praktycznego stosowania narzędzi językowych dla języka niemieckiego, angielskiego i hiszpańskiego. Oferent powinien przedstawić wraz z ofertą listę zawierającą nazwy projektów/publikacji/patentów wraz z krótkim opisem zakresu prac jakie były powierzone Wykonawcy. W przypadku braku możliwości przesłania informacji na temat projektu (np. umowa o poufności), prosimy o ogólne informacje związane z zakresem powierzonym prac.
Typ
Dodatkowe warunki udziału
Opis
W celu uniknięcia konfliktu interesów zamówienia publiczne, z wyjątkiem zamówień sektorowych, udzielane przez beneficjenta niebędącego podmiotem zobowiązanym do stosowania ustawy Prawo zamówień publicznych zgodnie z art.3 ustawy, nie mogą być udzielane podmiotom powiązanym z nim osobowo lub kapitałowo. Przez powiązania kapitałowe lub osobowe rozumie się wzajemne powiązania między beneficjentem lub osobami upoważnionymi do zaciągania zobowiązań w imieniu beneficjenta lub osobami wykonującymi w imieniu beneficjenta czynności związane z przygotowaniem i przeprowadzeniem procedury wyboru wykonawcy a wykonawcą, polegające w szczególności na: - uczestniczeniu w spółce jako wspólnik spółki cywilnej lub spółki osobowej - posiadaniu co najmniej 10 % udziałów lub akcji pełnieniu funkcji członka organu nadzorczego lub zarządzającego, prokurenta, pełnomocnika - pozostawaniu w związku małżeńskim, w stosunku pokrewieństwa lub powinowactwa w linii prostej, pokrewieństwa drugiego stopnia lub powinowactwa drugiego stopnia w linii bocznej lub w stosunku przysposobienia, opieki lub kurateli. Weryfikacja spełnienia warunku wykluczenia z postępowania odbywać się będzie na podstawie złożenia przez Oferenta podpisanego Oświadczenia o braku powiązań osobowych/kapitałowych z zamawiającym (wzór oświadczenia stanowi załącznik nr 2 do niniejszego zapytania).
Kryteria oceny
Czy kryterium cenowe
TAK
Opis
A. Całkowita Cena netto w PLN – max. 40 pkt CC = Cmin / CO * 40 pkt Gdzie: CC – liczba punktów za kryterium cena CO – cena netto oferty Cmin – najniższa cena netto oferty, która wpłynęła w odpowiedzi na zapytanie ofertowe Zamawiający zastrzega sobie możliwość odrzucenia oferty z najniższą ceną.
Czy kryterium cenowe
NIE
Opis
Technologia wykonania - max. 5 pkt
Czy kryterium cenowe
NIE
Opis
Zasoby kadrowe - max. 20 pkt
Czy kryterium cenowe
NIE
Opis
Znajomość języków - max. 5 pkt
Czy kryterium cenowe
NIE
Opis
Doświadczenie w udziale w projektach B+R - max. 15 pkt.
Czy kryterium cenowe
NIE
Opis
Doświadczenie w tworzeniu narzędzi NLP - max. 15 pkt.
Podsumowanie
Oś czasu związana z ogłoszeniem i ofertowaniem
2022-05-24 - data opublikowania
2022-05-30 - termin składania ofert
2022-06 - planowany termin podpisania umowy
Oś czasu realizacji przedmiotów zamówienia
Brak zdefiniowanych etapów dla przedmiotów zamówienia.
Szanowni Użytkownicy,
informujemy, że 25 marca 2025 r. został podniesiony dla zamówień próg determinujący stosowanie zasady konkurencyjności.
Obecnie wynosi on 80 tys. zł netto.
Więcej informacji znajdą Państwo w Wytycznych dotyczących kwalifikowalności wydatków na lata 2021-2027, dostępnych na stronie: https://www.funduszeeuropejskie.gov.pl/strony/o-funduszach/dokumenty/wytyczne-dotyczace-kwalifikowalnosci-2021-2027.