Programowe generowanie wartości pola w encji Hibernate (Spring Data)


We wpisie opisuję jak z poziomu kodu wygenerować pole w encji (ORM Hibernate) w aplikacji napisanej we frameworku Spring Boot oraz w języku Java. Tworzenie takiego pola przedstawiłem na przykładzie generowania sumy SHA-256 z kilku innych pól encji.

Wstęp

Prawdopodobnie witanie się słowami o dłuższej przerwie nie jest najszczęśliwsze. Dłuższe przerwy w jakiejkolwiek aktywności zazwyczaj nie są korzystne. Nie mniej natłok zajęć oraz pisanie pracy inżynierskiej spowodowały, że zaliczyłem dłuższą przerwę w aktywności tutaj. Zawiodła też nieco organizacja czasu, ale dzisiaj nie o tym.

Na uczelni uczestniczę w projekcie badawczo-rozwojowym mającym na celu utworzenie systemu informatycznego automatyzującego proces analizy zdjęć dna oka powstałych podczas angiografii fluorosceinowej. Moim zadaniem jest tworzenie aplikacji dostępowej dla końcowych użytkowników oraz realizacja warstwy pozyskiwania i przechowywania danych. Jedną z kwestii jest zapewnienie w miarę anonimowego dostępu do danych oraz przechowywanie zdjęć w sposób uporządkowany, ale jednocześnie niepozwalającej na powiązanie zdjęć z konkretnym pacjentem bez znajomości kilku danych osobowych.

Wymaganie projektowe

Jak wspomniałem powyżej, aplikacja musi przechowywać dane obrazowe względnie anonimowo. Ponadto, projekt zakłada udostępnienie kont użytkowników o ograniczonym dostępie – użytkownik o takich prawach, wprawdzie, będzie mógł przeglądać oraz opisywać zdjęcia wchodzące w skład pojedynczego badania, nie powinien mieć jednak pełnego dostępu do danych osobowych pacjenta. Celem tej funkcji jest umożliwienie studentom oraz praktykantom minimalnego użytecznego poziomu dostępu do systemu.

Zdjęcia powstałe w trakcie badania angiograficznego będą zapisywane w formie plików na dysku(ach) serwera, a w bazie znajdzie się wyłącznie odniesienie do właściwego pliku. Pliki z obrazami mogą być wykorzystywane przez inne narzędzia, dlatego przechowywanie danych binarnych bezpośrednio w bazie danych nie byłoby najlepszym rozwiązaniem – zazwyczaj lepiej przechowywać dane binarne poza strukturami bazodanowymi ze względu na lepszą wydajność, prostsze skalowanie systemu oraz mniejsze skomplikowanie backendu aplikacji1.

Z każdym użytkownikiem powinien być związany zatem unikalny identyfikator niepozwalający ustalić dalszych danych pacjenta. Wartość klucza głównego dla tabeli z pacjentami uznajemy za zbyt mało losową2.

Generowanie danych

Do spełnienia wymagania wystarczyłoby w zasadzie proste wygenerowanie losowego stringa z kilkunastoma znakami. Jeden z członków projektu zaproponował użycie funkcji skrótu SHA-256 jako wartości, która jest wystarczająco zanonimizowana – znając tylko skrót bardzo trudno uzyskać dane wejściowe. Wiedząc już, czego chcemy użyć, czas przystąpić do implementacji.

Na początek zaimplementujmy funkcję generującą skrót dla kilku danych składowych. Do obliczania funkcji skrótu wykorzystałem biblioteczną klasę MessageDigest wchodzącą w skład pakietu java.security. Następnie utworzyłem stringa zawierającego dane, z których utworzona ma zostać wartość skrótu oraz skonwertowałem go na tablicę bajtów zgodną z kodowaniem UTF-83. Konwersji dokonałem, gdyż funkcja obliczająca wartość skrótu wymaga podania na wejściu tablicy bajtów, zwracając również wynik w takiej formie. Na sam koniec skonwertowałem tablicę bajtów na jej czytelną, szesnastkową reprezentację wykorzystując funkcję statyczną z klasy klasę javax.xml.bind.DatatypeConverter i zapisałem do właściwego pola w encji.

public void calculateSha256() throws NoSuchAlgorithmException {
 final Logger log = LoggerFactory.getLogger(this.getClass());
 try {
  MessageDigest digest = MessageDigest.getInstance("SHA-256");
  String textToHash = firstName + lastName + birthdate.toString();
  byte[] bytesToHash = textToHash.getBytes(StandardCharsets.UTF_8);
  byte[] hashed = digest.digest(bytesToHash);
  sha256 = DatatypeConverter.printHexBinary(hashed);
 } catch (NoSuchAlgorithmException e) {
  log.error("SHA-256 algorithm required to save Patient's hash not found!", e);
  throw e;
}

Mamy już gotowe generowanie wybranego pola, czas teraz poinformować ORM, że powyższa metoda powinna być wywoływana przy operacjach dodawania oraz edycji danych. W tym celu wystarczy dodać dwie adnotację przed deklaracją metody. Adnotacja PreUpdate powoduje, że ORM wywoła wybraną funkcję przed dokonaniem operacji aktualizacji danych w bazie danych. PrePersist natomiast wywoływane jest przed dodaniem nowego rekordu do bazy danych.

@PreUpdate
@PrePersist
public void calculateSha256() throws NoSuchAlgorithmException {...}

W ten sposób uzyskamy oczekiwane zachowanie. Poniżej przedstawiam przykładowe zapytanie utworzenia zasoby oraz uzyskaną odpowiedź z serwera.

Przypadek szczególny

W trakcie realizacji oraz testowania zauważyłem, że skrót obliczany w zaproponowany sposób może być nie być unikatowy w jednym, szczególnym przypadku: będzie dwóch pacjentów o tym samym imieniu, nazwisku i dacie urodzenia. Wprawdzie nie jest to sytuacja bardzo prawdopodobna, jednak postanowiłem zabezpieczyć system przed jej wystąpieniem.

Początkowo planowałem użyć pola ID. Te jednak jest, oczywiście, ustalane dopiero w momencie dodania danych do bazy i uwzględnienie jego wymagałoby wykonania dwóch dodatkowych zapytań: pobrania nowo dodanej encji z bazy danych oraz zaktualizowania jej o wyliczoną sumę SHA-256. Postanowiłem dodać dodatkową składową w postaci krótkiego, (pseudo)losowego stringa. Utworzyłem więc prostą metodę generującą.

private String randomSeed() {
 Random r = new Random();
 StringBuilder stringBuilder = new StringBuilder();
 for (int i = 0; i < SEED_LENGTH; i++) {
  stringBuilder.append((char)(r.nextInt(93) + 33));
 }
 return stringBuilder.toString();
}

W głównej metodzie dodałem jedynie odwołanie pozwalające wygenerować takie „ziarno” w przypadku, gdy tworzony jest nowy rekord w bazie. Dzięki temu uzyskałem zadowalający efekt.

Podsumowanie

Dziś dowiedzieliśmy się jak, w prosty sposób, generować z poziomu kodu wartość wybranej encji. Jest to, jak widać bardzo proste i ogranicza się do napisania przynajmniej jednej prostej metody opatrzonej stosowną adnotacją. Generowanie skrótu jest oczywiście tylko jednym z zastosowań takich zdarzeń. Postarałem się także wyjaśnić, na rzeczywistym przykładzie, gdzie mechanizm zdarzeń encji w ORM Hibernate może zostać wykorzystany.

Mam nadzieję, że niniejszy wpis był pomocny. Z góry przepraszam za możliwe błędy, czy niedopatrzenia wynikające z mojej niewiedzy lub nieświadomości lepszych rozwiązań. Ten wpis jest także wstępem do innych, w których będę prezentował inne wypracowane przeze mnie ciekawe rozwiązania niektórych problemów programistycznych.

PS

Na Linuksie, żeby napisać znak myślnika (–) w tekście wystarczy nacisnąć kombinację klawiszy Ctrl+Shift+U oraz 2013. Cudzysłów otwierający to 201E, a zamykający 201D ;-).


1 Zdjęcia należą do danych statycznych, które bardzo dobrze obsługują serwery WWW typu Apache czy Nginx. Przechowywanie obrazków w bazie danych wymagałoby dodatkowego kodu w aplikacji odpowiedzialnego za: pobranie obrazka z bazy danych, przygotowanie odpowiedzi oraz zwrócenie strumienia danych do klienta. Wprowadzałoby to dodatkowe obciążenie do całej aplikacji oraz uniemożliwiłoby wydzielenie zdjęć na osobny serwer lub usługę typu CDN.

2 Hipotetycznie, obserwując liczbę pacjentów danego dnia, możemy założyć, że część z nich będzie badana pierwszy raz, więc na podstawie cichej obserwacji oraz znajomości najnowszego ID można spróbować wywnioskować, jakie ID będzie miał kolejny pacjent.

3 W rozważanym przypadku nie miało to większego znaczenia, równie dobrze mogłem wybrać inną reprezentację tekstu, byle mogła ona zakodować znaki, które mogą pojawić się w danych wejściowych.


Kategoria: Java | Programowanie


Napisz odpowiedź lub dodaj komentarz


Twój adres e-mail nie będzie opublikowany. Pola oznaczone gwiazdką * są wymagane

Możesz używać tych znaczników HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>