Bescherm klant- en betalingsgegevens
Nauwkeurige risicobeoordeling en fraudedetectie
Verbeter klinische tests en bescherm patiëntgegevens
Verhoog productiestabiliteit & prestaties
Train, test en verbeter ML-modellen
Samenwerken tussen teams en organisaties
BlueGen simuleert echte data en genereert privacyveilige synthetische die alle mogelijkheden van data ontgrendelen
BlueGen's hoofdfunctie is synthetische data genereren die echte data simuleert en privacy garandeert. Het BlueGen platform gebruikt AI om van echte tabelgegevens te leren en vervolgens data met dezelfde statistische spreiding, bedrijfsregels en referentiële integriteit te creëren.
BlueGen past differentiële privacy toe. Dit is een wiskundige definitie van privacy die zorgt voor bewezen privacyveilige gegevens die eruitzien en zich gedragen als de originele gegevens.
BlueGen kan datasets uitbreiden door nieuwe datapunten uit bestaande data te genereren om bijvoorbeeld trainingsdata voor het verbeteren van ML-modellen te maken. Of om grensgevallen voor softwaretesten te genereren. Uitbreiden kan ook omgekeerd werken en een subset van de echte data genereren wanneer een kleine dataset voldoende is.
Met het federated learning framework van BlueGen kunnen meerdere gebruikers samenwerken om synthetische data te genereren zonder hun echte gegevens te delen. BlueGen gebruikt dan alleen de structuur en kenmerken van de verschillende gegevensbronnen om op grote schaal veilig en efficiënt meer diverse datasets te creëren.
BlueGen kan op locatie draaien in uw datacenter of in uw private cloud. In de cloud gebruikt u het BlueGen platform en de benodigde computercapaciteit vanuit een lokale (browser)agent via het federated learning framework. De data blijven dan op locatie omdat BlueGen alleen de structuur en kenmerken van de data naar het (cloud)platform stuurt.
BlueGen is gebouwd om onvolledige datasets met ontbrekende waarden, complexe datadistributies en hoogdimensionale categorische kolommen te verwerken zoals die in de praktijk vaak voorkomen.
Naast CSV-bestanden kan BlueGen ook direct verbinding maken met databases om synthetische gegevens te genereren. Ondersteunde databases zijn MS SQL Server, Oracle, PostgreSQL, MySQL en SQLite. Verder zijn er connectoren beschikbaar voor SAP HANA, Snowflake en AWS Redshift. En via de Command Line Interface (CLI) kan BlueGen in data-engineering en CI/CD-pipelines opgenomen worden.