ICLUSTER - EX 5733ICL ICLUSTER IBM 5.2.0

Dal 4 Gennaio 2012 il prodotto iCluster IBM è stato acquisito dalla Rocket, (il servizio e supporto IBM resterà comunque lo stesso di prima.)
http://www.rocketsoftware.com/icluster/support/index

Versione Draft

Nome della società

Azienda Contatti

IBM Contact

Introduzione

Questo documento delineerà una procedura di base per la commutazione (RoleSwitch) dei sistemi AS400 della companyname . Questo processo dovrebbe essere modificato considerando le specifiche esigenze del cliente e le particolarità delle connessioni dei sistemi AS/400.

La Commutazione può essere definita come lo spostamento dei processi da un sistema primario di produzione a un sistema secondario di backup , nota anche come ruolo di inversione RoleSwitch. Il sistema secondario, assume il ruolo di Sistema primario ed è in grado di continuare l'elaborazione di business dei dati e delle applicazioni, assicurando che i terminale ed i dispositivi originariamente collegata al sistema primario siano re-indirizzati. Una volta che il rovesciamento dei ruoli è completo, il processo di commutazione può essere eseguito ancora una volta quando il sistema primario originale (ora il nuovo secondario) torna di nuovo disponibile. La sincronizzazione potrebbe richiedere un aggiornamento del nastro a seconda della dimensione dei dati che devono essere spostati. quando i due sistemi devono essere risinconizzati.

La Commutazione comprende due componenti:

       Commutazione Hardware (per i dispositivi collegati)

       Commutazione Software (per l'inversione di ruolo dei dati e delle applicazioni, e vedere anche la commutazione di componenti hardware se necessarie.)

La commutazione può avvenire in due modi:


          Automatizzato di Cluster Services IBM il passaggio al digitale e Monitor System (DCM)
           Manuale tramite il comando DMCHGROLE

         
 Questo approccio sarà utilizzato e delineata soprattutto nel presente documento.

Eventi di commutazione sono causati in due modi:


          Prevista per attività quali aggiornamenti SW , PTF , etc

          Non pianificata in situazioni di disastro

Di seguito è riportato un elenco di controllo che illustra le misure specifiche che devono essere adottate per realizzare uno scambio di ruolo. La Commutazione o Roleswitch come descritto di seguito è costituito da una combinazione di passi che sono eseguiti sia con controlli e comandi manuali sia con procedure automatizzate che l'utente potrebbe eseguire insieme a passi manuali necessari (ovvero scollegare e collegare cavi, ecc). Ogni fase definita deve essere eseguita nella sequenza prevista dello scambio di ruolo dei sistemi

 

Procedure di commutazione
Test di RoleSwitch tra due sistemi AS400 in replica con iCluster IBM.
Nei test che vengono descritti si suppone di avere i sistemi collegati con gli indirizzi IP x iCluster diversi da quelli utilizzati per i collegamenti degli utenti al sistema.
Che cosa è bene sapere prima di iniziare i test di commutazione

Il cambio di ruolo puo’ essere effettuato tramite due modalita’:
1) Con i gruppi attivi, utilizzando il comando DMSTRSWO   (Funzione 20 del menu: Work with icluster groups)

2) Con i gruppi inattivi utilizzando il comando DMCHGROLE.  (Procedura consigliata)

Il prodotto iCluster IBM è predisposto per eseguire una commutazione (SWITCHOVER) a livello di GRUPPI e NODI ATTIVI che è possibile richiamare con il comando DMSTRSWO
Il comando viene eseguito con i NODI ATTIVI
iCluster Start Switchover (DMSTRSWO)
Immettere le scelte e premere Invio.
Group . . . . . . . . . . . . . Name, *ALL
Re-start replication . . . . . . *YES *YES, *NO

Il prodotto iCluster IBM offre la possibilità di eseguire una commutazione di ruolo per il NODO e GRUPPI sul TARGET a fronte di un problema grave (FAILOVER) su Produzione.
Il comando viene eseguito con i NODI NON ATTIVI
iCluster Change Primary (DMCHGROLE)
Immettere le scelte e premere Invio.
Group or resilient application Name, *ALL, *PRIMNODE

Condizione di Funzionamento normale del prodotto iCluster
AMBIENTE DI PRODUZIONE
GO DMCLUSTER Opz. 80

Status del sistema AS400 - A - = NODO SOURCE

Nodo Source e Target attivi in Rete.
Gruppi Attivi.
Invio Voci di Giornale da Source a Target.
AMBIENTE DI BACKUP

Voci di
giornale
ricevute
nella Libreria
DMSTORE
GO DMCLUSTER Opz. 81

Status del sistema AS400 - B - = NODO TARGET
Nome Sistema ------------
Indirizzo IP ---------------

Gruppi ICLUSTER
Primary--------------
Secondary------------
System---------------
Nome Sistema ------------
Indirizzo IP ---------------

Gruppi ICLUSTER
Primary--------------
Secondary------------
System---------------
Nella condizione di funzionamento normale, il prodotto Icluster invia tutte le operazioni scritte sui giornali definiti nei gruppi, ed inserite nei ricevitori del sistema in produzione
Dopo l' invio delle voci di giornale sul sistema di Backup , un lavoro per ogni gruppo si occuperà di riapplicare queste voci nella sequenza temporale così come sono accadute in produzione,
leggendo queste voci dalla libreria DMSTORE, che rappresenta il contenitore di transito di tutte le operazioni che saranno eseguite per mantenere i sistemi Source e target sincronizzati.



Test 1- Simulazione di uno SWITCHOVER

Definizione delle fasi necessarie per passare in produzione con il sistema di Backup dopo una Commutazione pianificata e con i sistemi entrambi attivi.
Fase - A sul sistema Source
1A- Interruzzione delle attività utente ENDSBS, - controllare che non ci siano lavori utente attivi.

2A- Chiusura controllata dei gruppi di replica -DMENDGRP GROUP (* ALL)

3A-ENDTCPIFC INTNETADR (indirizzo ip dove si collegano gli utenti)- per scollegare tutti gli utenti dal sistema

4A - Controllare il Sottosistema XDMCLUSTER per verificare che tutti i lavori siano terminati, Verificare e considerare modifiche al WRKJOBSCDE , e QSTRUP,

5A- -Dal Menu GO DMCLUSTER , terminare il NODO SOURCE
Per terminare il nodo è necessario utilizzare DMWRKNODE l'opzione 4-End  DMENDNODE NODE (SOURCE))

6A -Verificare se il Nodo TARGET è diventato MASTER NODE, se si ,attivarlo con OPZ.1

Disattivazione del collegamento in rete Modifica Idirizzo IP
se il sistema deve diventare Backup
Chiusura controllata dei gruppi
GO DMCLUSTER Opz. 80


Fase - B sul sistema Target
1B- Interruzzione delle attività , -
2B- Controllare che non ci siano in esecuzione lavori icluster di aggiornamento e modifiche dati
- ed oggetti esclusi o fuori sincronia
eseguire il comando DMENDGRP GROUP (* ALL)
3B-ENDTCPIFC INTNETADR (indirizzo ip )- per scollegare tutti gli utenti dal sistema
4B - Per Passare sul sitema TARGET da Backup a Produzione, dare il comando DMCHGROLE per consentire la modifica del sistema da ruolo secondario a primario. Questo comando di esecuzione-DMCHGROLE farà eseguire i lavori chiamati (CSJOBD, OMSTRAPY e DM_PRIMPRE uno per ogni gruppo.

5B -Assicurarsi che 'ogni' lavoro DM_PRIMPRE sia completato
Controllare con
WRKSPLF DMCLUSTER F 18

Assicurarsi che il sistema di Backup sia ora primario.Solo dopo questi controlli avviare i servizi TCP IP utilizzando gli indirizzi del sistema di Produzione.

6B -STRTCPIFC INTNETADR

Voci ricevute
nella Libreria
DMSTORE
Modifica Indirizzo IP
da Backup a Primario
prima di far collegare gli utenti.
GO DMCLUSTER Opz. 81

Status del sistema dopo le operazioni Nodo Target = Master Node
Fase - C sul sistema Target
1C- Avviare il mirroring di ogni gruppo utilizzando i punti contrassegnati ruolo svolto da cambiare la routine.

GRUPPO DMSTRGRP (SYSTEM) STRAPY (* YES) USEMARKED (* YES)
DMSTRGRP GROUP (il gruppo) STRAPY (* YES) USOMARKED (* YES)
DMSTRGRP GROUP (il gruppo) STRAPY (* YES) USEMARKED (* YES)
DMSTRGRP GROUP (il gruppo) STRAPY (* YES) USOMARKED (* YES)

Al termine di queste operazioni il sistema di Backup sarà il nuovo sistema di produzione, e tutte le modifiche effettuate sui dati del sistema B saranno riportate sul sistema A

Fase - D sul sistema Target
1D - A questo punto il sistema Target è pronto per essere utilizzato dagli utenti come sistema di produzione,
Controllare ancora che il QSTRUP , lo schedulatore WRKJOBSCDE, el' indirizzario WRKDIRE, siano come richiesto nel sistema di produzione:
Avviare i sottosistemi e le attività in produzione.
Spedire una email agli utenti per avvisare che il sitema è nuovamente disponibile.
E' possibile lanciare il Syncheck nei gruppi per avere il controllo della sincronizzazione degli oggetti.

Voci ricevute
nella Libreria
DMSTORE
Indirizzo IP sistema
di Backup

Indirizzo IP sistema di produzione
Controllare - QSTRUP - WRKJOBSCDE -WRKDIRE - WRKRPYLE - SYSVAL -


Test 2- Simulazione di un FAILOVER

Definizione delle fasi necessarie per passare in produzione con il sistema di Backup dopo un Failover del sistema di produzione, Commutazione del sistema di Backup a causa di un errore imprevisto sul sistema di produzione.
Sistema di produzione in errore
e non più disponibile.
GO DMCLUSTER Opz. 80

Fase - B sul sistema Target
1B- Interruzzione delle attività , -
2B- Controllare che non ci siano in esecuzione lavori icluster di aggiornamento e modifiche dati
- ed oggetti esclusi o fuori sincronia
eseguire il comando DMENDGRP GROUP (* ALL)
3B-ENDTCPIFC INTNETADR (indirizzo ip )- per scollegare tutti gli utenti dal sistema
4B - Per Passare sul sitema TARGET da Backup a Produzione, dare il comando DMCHGROLE per consentire la modifica del sistema da ruolo secondario a primario. Questo comando di esecuzione-DMCHGROLE farà eseguire i lavori chiamati (CSJOBD, OMSTRAPY e DM_PRIMPRE uno per ogni gruppo.

5B -Assicurarsi che 'ogni' DM_PRIMPRE lavoro sia completato.

Assicurarsi che il sistema di Backup sia ora primario.Solo dopo questi controlli avviare i servizi TCP IP utilizzando gli indirizzi del sistema di Produzione.

6B -STRTCPIFC INTNETADR

Voci ricevute
nella Libreria
DMSTORE
GO DMCLUSTER Opz. 81

Status del sistema AS400 - B - = NODO TARGET

Fase - C sul sistema Target
1C- Avviare il mirroring di ogni gruppo utilizzando i punti contrassegnati ruolo svolto da cambiare la routine.

GRUPPO DMSTRGRP (SYSTEM) STRAPY (* YES) USEMARKED (* YES)

DMSTRGRP GROUP (il gruppo) STRAPY (* YES) USOMARKED (* YES)

DMSTRGRP GROUP (il gruppo) STRAPY (* YES) USEMARKED (* YES)

DMSTRGRP GROUP (il gruppo) STRAPY (* YES) USOMARKED (* YES)

Al termine di queste operazioni il sistema di Backup sarà il nuovo sistema di produzione, e tutte le modifiche effettuate sui dati del sistema B saranno riportate sul sistema A

Fase - D sul sistema Target
1D - A questo punto il sistema Target è pronto per essere utilizzato dagli utenti come sistema di produzione,
Controllare ancora che il QSTRUP , lo schedulatore WRKJOBSCDE, el' indirizzario WRKDIRE, siano come richiesto nel sistema di produzione:
Avviare i sottosistemi e le attività in produzione.
Spedire una email agli utenti per avvisare che il sitema è nuovamente disponibile.
E' possibile lanciare il Syncheck nei gruppi per avere il controllo della sincronizzazione degli oggetti.
 
NOTE: Informazioni aggiuntive sulla libreria DMSTORE
Concetti principali:






Esempio di documentazione utile per eseguire una commtazione guidata dei sistemi Source e Target

1.           Operazioni da eseguire in caso di Role Swap

Le operazioni descritte di seguito fanno riferimento a personalizzazioni effettuate sui due sistemi oggetto del servizio di Business Continuity del Cliente XXXXXXX:  AS400-A1, (SISTEMA SOURCE) è il sistema di produzione (normalmente SOURCE o *PRIMARY) e AS400-B2, ( SISTEMA TARGET) è il sistema di Back-Up (normalmente TARGET  o *BACKUP).

Per accedere al menù di iCluster aprire una sessione con utente Qsecofr e immettere il comando ADDLIBLE  ICLUSTER     e   poi GO DMCLUSTER

1.1                 Role Swap Pianificato

1.1.1                  Chiusura di tutti i lavori sul AS400-A1

Nota: Queste attività vanno eseguite con utente QSECOFR e da una sessione di lavoro aperta su HMC in Console.

Chiedere a tutti gli utenti di chiudere ordinatamente tutti i lavori attivi.

Congelare le code e accertarsi che non ci siano lavori Batch in esecuzione. In caso contrario aspettare il loro completamento o, se è il caso, forzarne la chiusura

WRKJOBSCDE SEQ(*DATETIME)

Congelare tutte le schedulazioni  coinvolte nel periodo e controllare che non ci siano lavori in coda.

1.1.2                  Controllo eventuali oggetti fuori sincronismo

Sul Sistema AS400-A1 accedere al menù principale “iCluster Enterprise Edition main menu usando il comando “GO DMCLUSTER”. Selezionare l’opz.80 per visualizzare la schermata “Real Time Object latency” quindi  immettere l’Opz. 8 (OBJSTS) in corrispondenza del giornale o giornali del gruppo. Accertarsi che non siano elencati oggetti fuori sincronia.

1.1.3                  Arresto dell’interfaccia IP sul Source

Su AS400-A1  disabilitare le interfacce IP di produzione, attualmente 10.58.191.30  (IP Virtuale)   

ENDTCPIFC  10.58.191.30            

1.1.4                  Controllo transazioni sul AS400-B2

Accedere al sistema AS400-B2 e  con l’opz. 81 del menu DMCLUSTER accertarsi che tutte le voci di Giornale siano state applicate sul Target sia per il Giornale QAUDJRN, HADJRN, HABSFJRN . Il Sequence Number nelle colonne Primary J/E e Backup J/E  devono essere uguali su ogni gruppo. (Premere PF11 per visualizzare la schermata corretta)

1.1.5                 Role Swap dal Sistema di produzione: AS400-A1

Il cambio di ruolo puo’ essere effettuato tramite due modalita’:

1) Con i gruppi attivi, utilizzando il comando DMSTRSWO   (Funzione 20 del menu: Work with icluster groups)

2) Con i gruppi inattivi utilizzando il comando DMCHGROLE.  (Procedura consigliata)

A seguire la procedura utilizzando il comando DMCHGROLE.

Sul sistema AS400-A1  dall’ iCluster main menu selezionare l’Opz. 2 (Work with Group).. Nella successiva schermata  selezionare l’Opz. 4 (ENDGROUP) in corrispondenza del primo gruppo. iCluster effettuerà le operazioni di chiusura del gruppo. Attendere il messaggio di completamento. Verificare tramite Pf5 che il gruppo sia in stato INACTIV.

Ripetere questa operazione per tutti i gruppi dei quali si vuole invertire il ruolo.

Una volta chiusi i gruppi, dalla riga comandi lanciare il comando DMCHGROLE, e inserire il nome del gruppo che deve invertire il ruolo.

Attendere il completamento senza errori di questo comando e verificare che il gruppo ritorni nello stato: INACTIV.

Ripetere il comando DMCHGROLE (change role) per tutti i gruppi configurati.

A questo punto avremmo tutti i gruppi che hanno invertito il ruolo originale, ma non e’ ancora stata attivata la replica dei dati dal NODOBCK verso il  NODOPRD.

In pratica il sistema ha predisposto un punto di partenza per la giornalizzazione delle transazioni sulla macchina di BACKUP:  AS400-B2.  (Da questo momento sarebbe quindi possibile iniziare a lavorare sul sistema di BACKUP: AS400-B2, in quanto tutte le transazioni verranno registrate).

Per attivare la  replica, posizionarsi su ciascun gruppo e selezionare l’opzione 1 (START)  immettendo questi parametri: 

STRAPY               *YES

USEMARKED      *YES

Verificare che tutti i gruppi si attivino correttamente e passino quindi allo stato di ACTIVE.

(Avvertenza:  il completamento di questa operazione puo’ richiedere alcuni minuti).

A questo punto e’ necessario  modificare le interfacce IP sul sistema Target in modo tale che il sistema riattivi il TCP/IP con gli indirizzi IP del SOURCE sul sistema TARGET.   

Cambiare il nome del sistema TCP

CFGTCP opz.12

Sul sistema Target

ADDTCPIFC 10.58.191.30             
Aggiunta interfaccia IP con indirizzo sistema SOURCE se non fosse già creata, ed essendo interfaccia virtuale associarla all’IP Fisico 10.58.191.20

STRTCPIFC INTNETADR('10.58.191.30')                Attivazione interfaccia IP di produzione

Attivare tutti i profili del sistema (se disabilitati) con i seguenti comandi:

Go DMCLUSTER

OPZ.  50 del MENU:

7. HA Switchover menu  

15. Enable/Disable user profiles                     HCHGUSRSTS (S/T)        usando il file $$REPLICA/PROFILI

Da questo momento il sistema di Backup è diventato il sistema
di Produzione e sarà riconosciuto come tale nella rete
.

Verificare il corretto stato di attivazione di tutti i sottosistemi di sistema e degli eventuali altri sottosistemi di applicazione.

Tramite il comando WRKJOBSCDE rilasciare tutti i lavori schedulati che devono essere attivati.

Da questo momento le attività di produzione possono riprendere. Il flusso di replica adesso va dal AS400-B2 (diventato *Primary) al AS400-A1 (diventato *Backup)

.              

1.2                 Ripristino dei ruoli originari

Per riportare i sistemi al loro ruolo di origine occorre ripetere le operazioni  descritte al precedente paragrafo 5.1. In questo caso i sistemi Target e Source sono invertiti, e precisamente, AS400-B2 = SISTEMA SOURCE è il sistema in  produzione (Ruolo *Primary) mentre il AS400-A1  = SISTEMA TARGET è il sistema di backup (Ruolo *Backup)

Ecco quali sono le operazioni da effettuare.

1.2.1                  Chiusura di tutti i lavori sul AS400-B2

Nota: Queste attività vanno eseguite con utente QSECOFR e da una sessione di lavoro che sia sotto il controllo del sottosistema QCTL e non utilizzi l’indirizzo IP  primario. Si può quindi utilizzare la Console di sistema o un sessione telnet verso l’indirizzo 10.10.10.2. In questo caso una volta connessi eseguire un Transfer Job per spostare la sessione sotto il controllo del sottosistema QCTL. Per far ciò eseguire il comado: TFRJOB JOBQ(QCTL)   

Chiedere a tutti gli utenti di chiudere ordinatamente tutti i lavori attivi.

Congelare le code e accertarsi che non ci siano lavori Batch in esecuzione. In caso contrario aspettare il loro completamento o, se è il caso, forzarne la chiusura

Chiudere il sottosistema  QINTER.

Congelare tutte le schedulazioni.

1.2.2                  Controllo eventuali oggetti fuori sincronismo

Sul AS400-B2 accedere al menù principale “iCluster Enterprise Edition main menu usando il comando “DMCLUSTER”. Selezionare l’opz.80 per visualizzare la schermata “Real Time Object latency” quindi  immettere l’Opz. 8 (OBJSTS) in corrispondenza dei Giornali del gruppo e Accertarsi che non siano elencati oggetti fuori sincronia.

1.2.3                  Arresto dell’interfaccia IP sul Source Reverse

Sul AS400-B2  disabilitare le interfaccie IP alle quali accedono gli utenti :  

ENDTCPIFC    10.58.191.30

1.2.4                  Controllo transazioni sul AS400-A1

Accedere al sistema AS400-A1 e con il comando GO DMCLUSTER accedere all’opz. 81del menu DMCLUSTER. Accertarsi che tutte le voci di Giornale siano state applicate sul Target sia per il Giornale QAUDJRN che per gli altri. Il Sequence Number nelle colonne Primary J/E e Backup J/E  devono essere uguali. (Premere PF11 per visualizzare la schermata corretta)

1.2.5                  Role Swap sul AS400-B2

Sul sistema AS400-B2  dall’ iCluster main menu selezionare l’Opz. 2 (Work with Groups).. Nella successiva schermata  selezionare l’Opz. 4 (ENDGROUP) in corrispondenza del primo gruppo. iCluster effettuerà le operazioni di chiusura del gruppo. Attendere il messaggio di completamento. Verificare tramite Pf5 che il gruppo sia in stato INACTIV.

Ripetere questa operazione per tutti i gruppi dei quali si vuole invertire il ruolo.

Una volta chiusi i gruppi, dalla riga comandi lanciare il comando DMCHGROLE, e inserire il nome del gruppo che deve invertire il ruolo e quindi ritornare al suo ruolo originale.

Attendere il completamento senza errori di questo comando e verificare che il gruppo ritorni nello stato: INACTIV.

Ripetere il comando DMCHGROLE (change role) per tutti i gruppi configurati.

A questo punto avremmo di nuovo tutti i gruppi che sono ritornati al ruolo originale, ma non e’ ancora stata attivata la replica dei dati dal NODOPRD verso il  NODOBCK.

In pratica il sistema ha predisposto un punto di partenza per la giornalizzazione delle transazioni sulla macchina attuale di BACKUP (AS400-A1).  (Da questo momento sarebbe quindi possibile iniziare a lavorare sul sistema di Primary: AS400-A1, in quanto tutte le transazioni verranno registrate).

Per attivare la  replica, posizionarsi su ciascun gruppo e selezionare l’opzione 1 (START)  immettendo questi parametri: 

STRAPY             *YES

USEMARKED    *YES

Verificare che tutti i gruppi si attivino correttamente e passino quindi allo stato di ACTIVE.

(Avvertenza:  il completamento di questa operazione puo’ richiedere alcuni minuti).

Sempre sul sistema di PRODUZIONE – AS400-A1,  riattivare l’interfaccia di rete

STRTCPIFC 10.58.191.30              Riattivazione interfaccia IP con indirizzo sistema SOURCE

Da questo momento il sistema AS400-A1 è ridiventato il sistema di produzione e sarà riconosciuto come tale nella rete.

Verificare le schedulazioni (WRKJOBSCDE) e accertarsi che i lavori che devono andare in esecuzione non risultino congelati

Verificare la corretta attivazione di tutti i sottosistemi di sistema, e degli eventuali altri sottosistemi da attivare

Da questo momento le attività di produzione possono riprendere. Il flusso di replica adesso è ritornato ad essere dal sistema AS400-A1 (ridiventato *Primary) al sistema  AS400-B2 (ridiventato *Backup)