it-swarm.it

apache

Errore dell'encoder durante il tentativo di mappare la riga del frame di dati sulla riga aggiornata

Come preparare i dati in un formato LibSVM da DataFrame?

Encoder per il tipo di riga Spark set di dati

Come creare un frame di dati corretto per la classificazione in Spark ML

Differenza tra DataFrame, Dataset e RDD in Spark

Come gestire le caratteristiche categoriali con spark-ml?

Ottimizzazione join DataFrame - Broadcast Hash Join

"INSERT INTO ..." con SparkSQL HiveContext

Perché SparkContext si chiude a caso e come lo riavvii da Zeppelin?

Spark API set di dati - join

Come conservare oggetti personalizzati in Dataset?

Come creare un codificatore personalizzato in Spark 2.X Dataset?

Come dividere Vector in colonne - usando PySpark

Perché "Impossibile trovare l'encoder per il tipo archiviato in un set di dati" durante la creazione di un set di dati della classe di casi personalizzata?

Lettura di file CSV con campi tra virgolette contenenti virgole incorporate

Esegui un join digitato in Scala con Spark Dataset

Il valore dell'impostazione "spark.yarn.executor.memoryOverhead"?

Come faccio a convertire una colonna di array (cioè elenco) in Vector

Come cambiare il caso dell'intera colonna in minuscolo?

Quali sono i vantaggi di Apache Beam su Spark / Flink per l'elaborazione batch?

convertire dataframe in formato libsvm

Come convertire un dataframe in un set di dati in Apache Spark in Scala?

Come utilizzare le funzioni collect_set e collect_list in aggregazione con finestre in Spark 1.6?

Quali sono i vari tipi di join in Spark?

Spark streaming strutturato: unire set di dati statici con set di dati di streaming

Perché org.Apache.common.lang3 StringEscapeUtils è stato deprecato?

Apache Camel contro Apache Kafka

Come posso impedire la generazione di tonnellate di processi Apache quando avvio Apache e procedo all'uccisione della mia macchina?

Come modificare la codifica predefinita in UTF-8 per Apache?

Il modo migliore per accedere POST dati in Apache?

OSGi: Quali sono le differenze tra Apache Felix e Apache Karaf?

index.php non si carica di default

Come leggere la cella di Excel con Data con POI Apache?

Apache Camel e altri prodotti ESB

È necessario consentire le barre codificate su Apache

tomcat-dbcp vs commons-dbcp

Come ottenere un valore di cella vuoto Excel nel POI di Apache?

Come posso ottenere un corpo di risposta http come una stringa in Java?

Lettura XSSF di POI di Apache in file Excel

Apache HttpClient (4.1 e versioni successive): come eseguire l'autenticazione di base?

Apache Camel: endpoint "direct: start" - cosa significa?

.htaccess non funziona apache

Come ottenere dati dal vecchio punto di offset in Kafka?

Cosa fa l'operatore di frecce, '->', in Java?

HttpClient Java deprecato: quanto può essere difficile?

Apache POI autoSizeColumn viene ridimensionato in modo errato

Fast Hadoop Analytics (Cloudera Impala vs Spark / Shark vs Apache Drill)

Che cos'è esattamente Apache Karaf?

C'è un modo per eliminare tutti i dati da un argomento o eliminare l'argomento prima di ogni esecuzione?

Come si confrontano Jersey-client e Apache HTTP Client?

Host virtuale su Ubuntu 13.10 e Apache 2.4.6

HttpClientBuilder basic auth

Qual è la differenza tra CloseableHttpClient e HttpClient nell'API HttpClient di Apache?

Apache Kafka vs Apache Storm

Ribilanciamento del problema durante la lettura dei messaggi in Kafka

C'è un modo semplice per installare Kafka su Windows?

Esecuzione in LeaderNotAvailableException quando si utilizza Kafka 0.8.1 con Zookeeper 3.4.6

Qual è la differenza tra Apache Mahout e Apache Spark's MLlib?

Zookeeper è un must per Kafka?

Proxy Apache: nessun gestore di protocollo era valido

Come assegnare numeri contigui univoci agli elementi in un Spark RDD

Qual è la relazione tra lavoratori, istanze di lavoratori ed esecutori?

Errore di Apache Kafka su windows - Impossibile trovare o caricare la classe principale QuorumPeerMain

Analizzare CSV come DataFrame / DataSet con Apache Spark e Java

CollectionUtils in Java utilizzando il predicato

Come creare un argomento in Kafka attraverso Java

Non è stata specificata alcuna mappatura dell'intestazione, i valori dei record non sono accessibili per nome (Apache Commons CSV)

Concatenare set di dati di diversi RDD in Apache spark using scala

Unire due RDD ordinari con / senza Spark SQL

Perché i consumatori di Kafka si connettono a Zookeeper ei produttori ottengono metadati dai broker?

Estrai informazioni da un 'org.Apache.spark.sql.Row`

Come convertire Row di a Scala DataFrame nella classe case in modo più efficiente?

Querying Spark SQL DataFrame con tipi complessi

Quale tipo di cluster dovrei scegliere per Spark?

Come verificare se ZooKeeper è in esecuzione o attivo dal prompt dei comandi?

Aggiornamento di una colonna del frame di dati in spark

Come modificare i tipi di colonna in Spark SQL DataFrame?

Come convertire oggetto rdd in dataframe in spark

Kafka: Ottieni l'host broker da ZooKeeper

Spark Impossibile trovare il driver JDBC

Come eliminare le colonne nel frame di dati pyspark

Spark - carica il file CSV come DataFrame?

Qual è il modo più efficiente per filtrare un DataFrame

Un modo migliore per convertire un campo stringa in timestamp in Spark

Come analizzare gli oggetti JSON nidificati in spark sql?

Spark: come tradurre il conteggio (distinto (valore)) nelle API di Dataframe

Come ruotare DataFrame?

Rimozione di duplicati da righe basate su colonne specifiche in un DataDrive RDD/Spark

C'è un modo migliore per visualizzare l'intero Spark SQL DataFrame?

Calcolo della durata sottraendo due colonne datetime in formato stringa

Come ordinare per colonna in ordine decrescente in Spark SQL?

Come salvare DataFrame direttamente su Hive?

Quali sono/sono le principali differenze tra Flink e Storm?

Come aggiungere qualsiasi nuova libreria come spark-csv nella versione pre-installata di Apache Spark

Apache Spark, aggiungi una colonna "CASE WHEN ... ELSE ..." ad un DataFrame esistente

Come ottimizzare la fuoriuscita casuale in Apache Spark

Cosa impostare `SPARK_HOME` su?

Dove trovare il riferimento alla sintassi di Spark SQL?

Vieni definito il partizionamento di DataFrame?

Qual è la relazione tra Spark, Hadoop e Cassandra