Trasferimenti dei rapporti sul canale YouTube
BigQuery Data Transfer Service per YouTube consente di pianificare e gestire automaticamente i job di caricamento ricorrenti per i report sui canali YouTube.
Report supportati
- Report del canale (caricati automaticamente in BigQuery)
I report di BigQuery Data Transfer Service per canale YouTube supportano le seguenti opzioni di generazione dei report:
Opzione di segnalazione | Assistenza |
---|---|
Versione API supportata | 18 giugno 2018 |
Pianificazione | Ogni giorno, circa 14:10 UTC Puoi configurare l'ora |
Finestra di aggiornamento | Ultimo giorno Non configurabile. |
Durata massima del backfill | 30 giorni A partire da luglio 2018, i report di YouTube contenenti dati storici sono disponibili per 30 giorni a partire dal momento in cui vengono generati. I report che contengono dati non storici sono disponibili per 60 giorni. Per ulteriori informazioni, consulta la sezione Dati storici nella documentazione dell'API di reporting di YouTube. |
Per informazioni su come i report del canale YouTube vengono trasformati in tabelle e viste di BigQuery, consulta Trasformazioni dei report sui canali YouTube.
Importazione dati dai trasferimenti del canale YouTube
Quando trasferisci i dati da un canale YouTube a BigQuery, questi vengono caricati in tabelle BigQuery partizionate per data. La partizione della tabella in cui vengono caricati i dati corrisponde alla data dell'origine dati. Se pianifichi più trasferimenti per la stessa data, BigQuery Data Transfer Service sovrascrive la partizione per quella data specifica con i dati più recenti. Più trasferimenti nello stesso giorno o backfill in esecuzione non generano dati duplicati e le partizioni per altre date non sono interessate.Limitazioni
- La dimensione massima supportata del file per ogni report è 1710 GB.
- La frequenza minima per cui puoi pianificare un trasferimento di dati è una volta ogni 24 ore. Per impostazione predefinita, un trasferimento inizia nel momento in cui viene creato. Tuttavia, puoi configurare l'ora di inizio del trasferimento quando configuri il trasferimento.
- BigQuery Data Transfer Service non supporta i trasferimenti incrementali durante il trasferimento di un proprietario dei contenuti di YouTube. Quando specifichi una data per un trasferimento di dati, vengono trasferiti tutti i dati disponibili per quella data.
- Non puoi creare un trasferimento di un canale YouTube se hai eseguito l'accesso come identità federata. Puoi effettuare il trasferimento di un canale YouTube solo dopo aver eseguito l'accesso con un Account Google.
Prima di iniziare
Prima di effettuare il trasferimento di un canale YouTube:
- Verifica di aver completato tutte le azioni necessarie per abilitare BigQuery Data Transfer Service.
- Crea un set di dati BigQuery per archiviare i dati di YouTube.
Autorizzazioni obbligatorie
Per creare un trasferimento di un canale YouTube devi soddisfare i seguenti requisiti:
- YouTube: proprietà del canale YouTube
BigQuery: le seguenti autorizzazioni di Identity and Access Management (IAM) in BigQuery:
bigquery.transfers.update
per creare il trasferimento.bigquery.datasets.get
ebigquery.datasets.update
sul set di dati di destinazione.- Se intendi configurare le notifiche di esecuzione del trasferimento per Pub/Sub, devi disporre delle autorizzazioni
pubsub.topics.setIamPolicy
. Le autorizzazioni Pub/Sub non sono necessarie se configuri solo le notifiche via email. Per ulteriori informazioni, consulta Notifiche di esecuzione di BigQuery Data Transfer Service.
Il ruolo IAM predefinito bigquery.admin
include tutte le autorizzazioni BigQuery necessarie per creare un trasferimento di canale YouTube. Per ulteriori informazioni sui ruoli IAM in BigQuery, vedi Ruoli e autorizzazioni predefiniti.
Configurare il trasferimento di un canale YouTube
Per configurare il trasferimento di un canale YouTube devi:
- Suffisso tabella: un nome semplice per il canale fornito da te durante la configurazione del trasferimento. Il suffisso viene aggiunto all'ID job per creare il nome della tabella, ad esempio reportTypeId_suffix. Il suffisso viene utilizzato per impedire la scrittura di trasferimenti separati nelle stesse tabelle. Il suffisso della tabella deve essere univoco in tutti i trasferimenti che caricano i dati nello stesso set di dati e il suffisso deve essere breve per ridurre al minimo la lunghezza del nome della tabella risultante.
Se al momento utilizzi l'API di reporting di YouTube e hai già job di reporting, BigQuery Data Transfer Service carica i dati dei tuoi report. Se non hai job di generazione di report esistenti, la configurazione del trasferimento abilita automaticamente i job di generazione di report di YouTube.
Per creare un trasferimento di un canale YouTube:
Console
Vai alla pagina BigQuery nella console Google Cloud.
Fai clic su Trasferimenti.
Fai clic su Crea trasferimento.
Nella pagina Crea trasferimento:
Nella sezione Tipo di origine, per Origine, scegli Canale YouTube.
Nella sezione Nome configurazione trasferimento, in Nome visualizzato, inserisci un nome per il trasferimento, ad esempio
My Transfer
. Il nome del trasferimento può essere qualsiasi valore che consenta di identificare facilmente il trasferimento qualora fosse necessario modificarlo in un secondo momento.Nella sezione Opzioni di pianificazione:
In Frequenza di ripetizione, scegli un'opzione per la frequenza di esecuzione del trasferimento. Se selezioni Giorni, fornisci un orario valido nel formato UTC.
- Ore
- Giorni
- On demand
Se applicabile, seleziona Inizia ora o Inizia all'ora impostata e fornisci una data di inizio e un'ora di esecuzione.
Nella sezione Impostazioni destinazione, per Set di dati di destinazione, scegli il set di dati creato per archiviare i dati.
Nella sezione Dettagli origine dati:
- Per Suffisso tabella, inserisci un suffisso, ad esempio
MT
. Seleziona la casella Configura job per consentire a BigQuery di gestire per te i job di generazione dei report di YouTube. Se attualmente non esistono report di YouTube per il tuo account, vengono creati nuovi job di generazione dei report per abilitarli.
- Per Suffisso tabella, inserisci un suffisso, ad esempio
(Facoltativo) Nella sezione Opzioni di notifica:
- Fai clic sul pulsante di attivazione/disattivazione per abilitare le notifiche via email. Quando abiliti questa opzione, l'amministratore dei trasferimenti riceve una notifica via email quando un trasferimento non va a buon fine.
- In Seleziona un argomento Pub/Sub, scegli il nome dell'argomento o fai clic su Crea un argomento. Questa opzione consente di configurare le notifiche di Pub/Sub per il trasferimento.
Fai clic su Salva.
bq
Inserisci il comando bq mk
e fornisci il flag di creazione del trasferimento
--transfer_config
. Sono necessari anche i seguenti flag:
--data_source
--target_dataset
--display_name
--params
bq mk \ --transfer_config \ --project_id=project_id \ --target_dataset=dataset \ --display_name=name \ --params='parameters' \ --data_source=data_source
Dove:
- project_id è l'ID progetto.
- dataset è il set di dati di destinazione per la configurazione del trasferimento.
- name è il nome visualizzato della configurazione di trasferimento. Il nome del trasferimento può essere qualsiasi valore che consenta di identificare facilmente il trasferimento qualora fosse necessario modificarlo in un secondo momento.
- parameters contiene i parametri per la configurazione di trasferimento
creata in formato JSON. Ad esempio:
--params='{"param":"param_value"}'
. Per i trasferimenti dei canali YouTube, devi fornire il parametrotable_suffix
. Facoltativamente, puoi impostare il parametroconfigure_jobs
sutrue
per consentire a BigQuery Data Transfer Service di gestire i job di generazione dei report di YouTube per te. Se al momento non esistono report di YouTube per il tuo canale, vengono creati nuovi job di generazione dei report per abilitarli. - data_source è l'origine dati:
youtube_channel
.
Puoi anche fornire il flag --project_id
per specificare un
progetto specifico. Se --project_id
non è specificato, viene utilizzato il progetto predefinito.
Ad esempio, il seguente comando crea un trasferimento da canale YouTube denominato My Transfer
utilizzando il suffisso della tabella MT
e il set di dati di destinazione mydataset
. Il trasferimento viene creato nel progetto predefinito:
bq mk \
--transfer_config \
--target_dataset=mydataset \
--display_name='My Transfer' \
--params='{"table_suffix":"MT","configure_jobs":"true"}' \
--data_source=youtube_channel
API
Utilizza il metodo projects.locations.transferConfigs.create
e fornisci un'istanza della risorsa TransferConfig
.
Java
Prima di provare questo esempio, segui le istruzioni per la configurazione di Java nella guida rapida di BigQuery sull'utilizzo delle librerie client. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Java di BigQuery.
Per eseguire l'autenticazione su BigQuery, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per le librerie client.
Eseguire query sui dati
Quando vengono trasferiti in BigQuery, i dati vengono scritti in tabelle partizionate in fase di importazione. Per ulteriori informazioni, consulta Introduzione alle tabelle partizionate.
Se esegui una query direttamente sulle tabelle anziché utilizzare le viste generate automaticamente, devi utilizzare la pseudo-colonna _PARTITIONTIME
nella query. Per maggiori informazioni,
consulta Esecuzione di query su tabelle partizionate.
Risolvere i problemi relativi alla configurazione del trasferimento di canali YouTube
Se riscontri problemi durante la configurazione del trasferimento, consulta la sezione Problemi di trasferimento di YouTube nella sezione Risoluzione dei problemi relativi alle configurazioni di trasferimento.