DataSpellEs handelt sich um eine IDE speziell für Data Science, die von JetBrains, dem Entwickler der bekannten Software IntelliJ Idea IDE und der Programmiersprache Kotlin, eingeführt wurde.

Diese IDE bietet eine Entwicklungsumgebung für Data-Science-Experten, die sich mit explorativer Datenanalyse und Prototyping von Machine-Learning-Modellen beschäftigen. Die Benutzeroberfläche ist so konzipiert, dass sie die Arbeit mit Daten priorisiert und gleichzeitig das Programmieren ermöglicht. Laut JetBrains unterstützt DataSpell Jupyter Notebooks und bietet ein verbessertes Benutzererlebnis im Vergleich zu herkömmlichen Jupyter Notebooks. Benutzer können zwischen Befehls- und Bearbeitungsmodus wechseln, um Zellen und deren Inhalte zu bearbeiten. Zu den erweiterten Funktionen gehören:

Intelligente Programmierunterstützung für Python
Sofort einsatzbereiter Katalog
Faltendes Backtracking
Interaktiver Tisch

Die Zellausgabe unterstützt Markdown und JavaScript. DataSpell ist mit Jupyter Notebooks kompatibel, die auf Ihrem lokalen Computer ausgeführt werden, sowie mit Remote-Jupyter-, JupyterHub- und JupyterLab-Servern.

Darüber hinaus unterstützt DataSpell Python-Skripte und bietet eine REPL zum Ausführen von Code sowie zusätzliche Tools für die interaktive und statische Arbeit mit Daten und deren Visualisierung. DataSpell unterstützt auch wissenschaftliche Python-Bibliotheken wie Plotly, Bokeh, ipywidgets und Altair. DataSpell befindet sich derzeit in der frühen Vorschauphase und bietet neben Python auch grundlegende Unterstützung für R. Zukünftig ist die Unterstützung weiterer Data-Science-Sprachen wie Julia geplant.

Die größte Herausforderung bei der Einführung eines neuen Tools ist natürlich die Benutzerfreundlichkeit, da jedes Data-Science-Team über eigene, häufig verwendete Tools und definierte Workflows verfügt. JetBrains steht außerdem vor der großen Herausforderung, DateSpell schnell in den Workflow des Data-Science-Teams zu integrieren, um die Produktivität zu steigern.

Änderungsprotokoll

Unser ML-Team hat das lokale Modell verbessert, das die ML-gestützte Vollzeilen-Codevervollständigung von Python ermöglicht, sodass es jetzt längere Vorschläge generieren und mehr Kontext berücksichtigen kann – und das alles ohne Daten an das Internet zu senden und völlig kostenlos.

In DataSpell 2024.1 können Sie jetzt SQL direkt in Jupyter Notebook schreiben, um DataFrames und CSV-Dateien abzufragen. Wir haben die Zelle „Daten importieren“ eingeführt, einen neuen Zellentyp in DataSpell. Sie können Dateien per Drag & Drop in Ihre tabellarischen Daten ziehen, um die Verarbeitung einfach zu starten.

Das neueste Update verbessert die dbt Core-Unterstützung erheblich. Sie können Diagramme jetzt direkt in DataSpell anzeigen. Wir haben die Codevervollständigung für dbt Core-Projekte verbessert, sodass Sie Modelle jetzt ganz einfach direkt aus SQL-Dateien ausführen, in der Vorschau anzeigen und testen können.

Laden Sie neue Versionen von DataSpell von unserer Website herunter, aktualisieren Sie direkt von der IDE oder über die kostenlose Toolbox-App oder verwenden Sie das Snap-Paket für Ubuntu.

ML-gestützte Codevervollständigung
Unser ML-Team hat das lokale Modell, das die ML-gestützte Codevervollständigung von Python ermöglicht, deutlich verbessert. Die Codevervollständigung generiert nun längere Vorschläge und berücksichtigt einen breiteren Kontext. Dies liefert bessere Vorschläge und erfordert weniger Tipparbeit. Dieses rein lokale Modell liefert Codevorschläge und vollständige Codezeilen, ohne Daten an externe Server zu senden.

SQL für DataFrames und CSV-Dateien
In DataSpell 2024.1 können Sie SQL schreiben, um DataFrames und CSV-Dateien direkt aus Jupyter Notebooks abzufragen. Erstellen Sie dazu zunächst eine SQL-Zelle, wählen Sie DataFrame als Datenquelle aus und schreiben Sie dann Ihre Abfrage mit hervorragender SQL-Codierungsunterstützung.

Dateneinheit importieren
Die Zelle „Daten importieren“ ist eine weitere neue Funktion für Jupyter Notebooks in DataSpell 2024.1. Ziehen Sie eine Datei mit tabellarischen Daten per Drag & Drop in die Zelle „Daten importieren“ und beginnen Sie mit der Verarbeitung mithilfe visueller Steuerelemente oder Python-Code.

dbt-Kern
Die neueste Version führt mehrere Updates für die bestehende dbt-Unterstützung ein:
DAGs sind ein leistungsstarkes Tool für Analytics-Ingenieure. Mit dieser Version können Sie sie jetzt direkt in DataSpell anzeigen. Die Navigation wurde ebenfalls vereinfacht, sodass Sie jetzt auf Knoten im DAG klicken können.
Die Codevervollständigung für das dbt Core-Projekt wurde erheblich verbessert, mit Updates zur Vervollständigung für Jinja, Modellnamen, Spaltennamen, YAML-Dateien und mehr.
Sie können jetzt jedes Modell ganz einfach direkt aus der SQL-Datei ausführen, in der Vorschau anzeigen und testen, indem Sie auf den Bindungsbereich klicken und aus den verfügbaren Optionen auswählen.

Haftungsausschluss: Alle Artikel auf dieser Website sind, sofern nicht anders gekennzeichnet, Originalveröffentlichungen dieser Website. Es ist jeder Person oder Organisation untersagt, diese Inhalte ohne unsere vorherige Zustimmung zu kopieren, zu missbrauchen, zu sammeln oder auf Websites, in Büchern oder anderen Medienplattformen zu veröffentlichen. Sollten Inhalte dieser Website die legitimen Rechte und Interessen des ursprünglichen Autors verletzen, kontaktieren Sie uns bitte zur Lösung.