Histogramm-basiertes Gradient Boosting

Ein Histogramm-basiertes Gradient Boosting Modell kann sowohl zur Klassifikation als auch zur Regression eingesetzt werden.

Das Modell basiert auf dem Gradient Boosting, allerdings werden hier die kontinuierlichen Eingänge mit Hilfe eines Histogramms in Bins diskretisiert. Dadurch wird das Training des Modells, gerade bei sehr großen Datensätzen, massiv beschleunigt.

Unterstützte Eigenschaften

ONNX-Support

Beispiele für den Export von Hist Gradient Boosting Modellen finden Sie hier: ONNX-Export von Hist Gradient Boosting.

Histogramm-basiertes Gradient Boosting 1:

Einschränkung bei Klassifikation

Bei Klassifikationsmodellen wird nur der Ausgang der Labels in der SPS abgebildet. Die Scores/Probabilities sind in der SPS nicht verfügbar.

Unterstützte Datentypen

Es ist zu unterscheiden zwischen „supported datatype“ und „preferred datatype“. Der preferred datatype entspricht der Präzision der Ausführungs-Engine.

Der preferred datatype ist floating point 64 (E_MLLDT_FP64-LREAL).

Bei Verwendung eines supported datatype wird eine effiziente Typ-Konvertierung automatisch in der Bibliothek durchgeführt. Durch die Typ-Konvertierung kann es zu minimalen Performance-Einbußen kommen.

Eine Liste der supported datatypes finden Sie unter ETcMllDataType.