]> andersk Git - moira.git/blobdiff - afssync/INSTRUCTIONS
Command line printer manipulation client, and build goo.
[moira.git] / afssync / INSTRUCTIONS
index f20b6a6ea49651f2d39c647a8c2eeffe1a0b1e59..6b3d94e8c7090e46efafc464f101eaa7acc1a6cd 100644 (file)
@@ -1,42 +1,85 @@
-[This is a still-under-construction rewrite of the afssync
-instructions, adapted to the Ingres/Maxine -> Oracle/SPARC port, and
-is also being updated and simplified.]
-
-
 The executables are in /moira/bin/ on the moira server, with sources
 in /mit/moiradev/src/afssync/.  Most of the commands are run on the
 Moira server.
 
-FULL INSTRUCTIONS
-("SUMMARY" is below)
+####   Set up a workspace                                              ####
+
+mkdir -p /moira/sync
+cd /moira/sync
 
 ####   This is preparation for the resync, to save non-Moira users.    ####
 First, get a recent copy of the prdb, and extract non-Moira entries:
 
-       /moira/bin/udebug orf -port 7002
-       rcp root@orf:/usr/afs/db/prdb.DB0 /var/prdb.old
-       /moira/bin/udebug orf -port 7002
+       /moira/bin/udebug prill -port 7002
+       rcp -px root@prill:/usr/afs/db/prdb.DB0 prdb.old
+       /moira/bin/udebug prill -port 7002
 If the two udebugs show that the version changed, lather-rinse-repeat.
-(udebug can be found in afsuser; "orf" here and below is some DB server)
+(udebug can be found in /usr/athena/bin; "prill" here and below is some 
+DB server)
 (Also check for "0 of them for write" at the end.  It might matter.)
 
-       /moira/bin/pt_util -x -m -u -g -d /var/prdb.extra -p /var/prdb.old
-       perl /moira/bin/pt_util.pl < /var/prdb.extra > /var/prdb.extra.sort
+       /moira/bin/pt_util -x -m -u -g -d prdb.extra -p prdb.old
+       perl /moira/bin/pt_util.pl < prdb.extra > prdb.extra.sort
 to extract and prepare the personal groups and special user entries in
 the old prdb for being reincorporated into the new prdb.
 
-       awk '/^[^ ][^:]*@/ {printf "KERBEROS:%s\n",$1}' prdb.extra > foreign
+       awk -F\| '$9 == 3 {print $1}' /backup/backup_1/users > /tmp/deactivated
+
+and the following perl script:
+
+#!/usr/athena/bin/perl -w
+
+open(OUT, ">prdb.extra.trimmed");
+
+for ( `cat /tmp/deactivated` ) {
+    chop;
+    $ex{$_} = 1;
+}
+
+$punt = 0;
+
+foreach $L ( `cat prdb.extra.sort` ) {
+    @w = split(/ /,$L);
+    $_ = $w[0];
+    if ( /:/ ) {
+        @x = split(/:/,$w[0]);
+        if ($ex{$x[0]}) {
+            $punt=1;
+        } else {
+            $punt=0;
+        }
+    } else {
+       # If we got here, we're either a user, a prefixless
+       # group, or a group member.
+       $punt = 0 if $w[0];
+    }
+    print OUT $L unless $punt == 1;
+}
+
+close(OUT);
+exit 0;
+
+to remove the personal groups for users who are deactivated
+
+       awk '/^[^ ][^:]*@/ {printf "KERBEROS:%s\n",$1}' prdb.extra.trimmed \
+               > foreign
        blanche afs-foreign-users -f foreign
 Get a list of all the @andrew.cmu.edu type (non- athena.mit.edu cell)
 users, and sync the Moira list afs-foreign-users to this list.
 Moira then adds those entries to the group system:afs-foreign-users,
 thus keeping them from being lost in the prdb resync.
+Sanity checking the diffs before running the blanche command is recommended.
 
-       awk '/^[^ ][^:@]*$/ {printf "KERBEROS:%s\n",$1}' prdb.extra > oddities
+       awk '/^[^ 0-9][^:@]*$/ {printf "KERBEROS:%s@ATHENA.MIT.EDU\n",$1}' \
+               prdb.extra.trimmed > oddities
+       awk '/^[^ ][0-9.]* .*$/ {printf "KERBEROS:%s\n",$1}' prdb.extra.trimmed\
+                >> oddities
        echo "LIST:afs-foreign-users" >> oddities
        blanche afs-odd-entities -f oddities
 Do the equivalent of afs-foreign-users for domestic users.  We make
 the afs-foreign-users list a member of the more general afs-odd-entities.
+Sanity checking the diffs before running the blanche command is recommended.
+
 WAIT for the incremental updates from the `blanche` changes to complete.
 
 ####   Now the actual resync begins.  Incremental updates must stop.   ####
@@ -47,34 +90,56 @@ afs.incr (?) will wait 30 minutes on an incremental update before
 timing out, so the resync should complete in that time, or list
 changes in Moira might need to be propagated by hand.
 
-       /moira/bin/afssync /var/prdb.moira
+       /moira/bin/afssync prdb.moira
 to dump the prdb data that is in Moira (users, groups, and group
 memberships).  This step takes about ten minutes, but can be done
 concurrently with the next few steps.
 
-REPEAT the first two sets of commands, above, thus regenerating
-prdb.extra from a now completely-up-to-date prdb.
+REPEAT the above commands, thus regenerating prdb.trimmed from a now
+completely-up-to-date prdb.
 
 *** Make sure the "afssync" command has completed ***
 
-       cp /var/prdb.moira /var/prdb.new
-       /moira/bin/pt_util -w -d /var/prdb.extra.sort -p /var/prdb.new
+       cp prdb.moira prdb.new
+       /moira/bin/pt_util -w -d prdb.extra.trimmed -p prdb.new \
+               >& prdb.extra.err
 This use of pt_util will presumably log errors about failed user
 creations and list additions.  (To start over, do both the `cp` and
 `pt_util` again.)  You can filter out the "User or group doesn't exist"
 type of lines that were caused by a user deactivation with something
 like:
-       awk -F\| '$8 == 3 {print $1}' /backup/backup_1/users > /tmp/deactivated
-       perl -e 'for(cat /tmp/deactivated`){ chop; $ex{$_}=1;} \
+       awk -F\| '$9 == 3 {print $1}' /backup/backup_1/users > /tmp/deactivated
+       perl -e 'for(`cat /tmp/deactivated`){ chop; $ex{$_}=1;} \
                foreach $L (`cat prdb.extra.err`){ $f=0; \
                @w=split(/[ :]/,$L); for(@w){ $f=1 if $ex{$_}; } \
                next if $f; print $L; }'
 Now, back to the resync.
 
-       pts listmax > /var/prdb.listmax
+The only remaining errors should be errors creating system:foo groups,
+be cause they already exist.  These generally mean that that group has
+an odd user on it (root instance, IP acl, etc.) and can safely be
+ignored.
+
+Errors of the form:
+Error while creating dcctdw:foo: Badly formed name (group prefix doesn't match owner?)
+are probably an indication that a user with personal groups had a
+username change (in the past they have also meant that a user with
+personal groups was deactivated and the uid was re-used (this was
+becasue we didn't trim the prdb.extra.sort file in the past.))
+Assuming htese errors are due to a username change, the groups should
+be renamed, and you should regenerate prdb.extra.trimmed starting with
+a fresh prdb from prill.  (You may want to abort and
+rm /moira/afs/noafs and try again later.)
+
+       pts listmax > prdb.listmax
+       foreach i ( <db servers> )
+           rsh $i -l root -x /bin/athena/detach -a     # detach packs
+           rsh $i -l root -x rm -f /usr/afs/db/{prdb.new,pre-resync-prdb}
+           rcp -px prdb.new root@${i}:/usr/afs/db/prdb.new
+       end                                             # staging
        foreach i ( <db servers> )
-           bos shutdown $i ptserver
-           bos exec $i "rm /usr/afs/db/prdb.DB*; mv /usr/afs/db/prdb.new /usr/afs/db/prdb.DB0"
+           bos shutdown $i ptserver -wait
+           bos exec $i "mv /usr/afs/db/prdb.DB0 /usr/afs/db/pre-resync-prdb; rm /usr/afs/db/prdb.DB*; mv /usr/afs/db/prdb.new /usr/afs/db/prdb.DB0"
        end
        foreach i ( <db servers> )
            bos restart $i ptserver
@@ -84,7 +149,7 @@ Now, back to the resync.
 to watch the status of the servers to make sure things are going well,
 where "prill" is preferred db server (the sync site).
 
-Make sure the beacons are working, and that once quorom is established
+Make sure the beacons are working, and that once quorum is established
 (~90 seconds) that the servers are resynchronizing their notions of
 the databases and that the "dbcurrent" and "up" fields all become set
 and the state goes to "1f".  Also, if "sdi" isn't running, watch out
@@ -93,18 +158,32 @@ fileservers may get excessively backlogged, and restart servers, if
 necessary, if the congestion remains excessive.
 
        pts listmax
-       cat /var/prdb.listmax
+       cat prdb.listmax
 and if the id maxima are lower than the saved ones, reset them
 appropriately to the saved ones using `pts setmax`.
 
        pts ex system:administrators
 as a good spot check, especially since it has special people.
 (also spot check one of the personal groups and perhaps, something like
-the membership of rcmd.ronald-ann)
+the membership of rcmd.reynelda)
 
        rm /moira/afs/noafs
 to remove the lock file and let Moira's afs incrementals continue.
 
+       The afssync program doesn't deal with null instance KERBEROS
+members of lists which are groups (example: if LIST zacheiss contains
+KERBEROS zacheiss@ATHENA.MIT.EDU).  To get around this, run:
+
+/moira/bin/sync.pl
+
+Which will create /var/tmp/sync.out, which contains the pts commands
+needed to add all the null instance KERBEROS members back to the pts
+groups they belong in.  If it looks sane, run:
+
+sh /var/tmp/sync.out
+
+Any failed additions are probably from lists that contain both USER
+username and KERBEROS username@ATHENA.MIT.EDU.
 
 NOTES
 
@@ -115,57 +194,3 @@ available, with certain mistakes.
 critical log, and you may have to do some operations by hand when the
 operation is complete.  Also, if requests depend on other requests, they
 may be processed out of order, and fail, and may need to be done by hand.
-
-
-SUMMARY
-
-       # db servers with sync site first:
-set db=(prill agamemnon chimera orf)
-set u="/moira/bin/udebug -port 7002 -server"
-set prefix="/moira/sync/prdb"
-cd `dirname $prefix`
-
-#######    The following DOES NOT WORK currently.  pt_util needs fixing
-####   BEFORE Moira and afs.incr are closed off:
-       # repeat as necessary:
-$u $db[2]; rcp root@$db[2]\:/usr/afs/db/prdb.DB0 $prefix.old; $u $db[2]
-/moira/bin/pt_util -x -m -u -g -d $prefix.extra -p $prefix.old
-awk '/^[^ ][^:]*@/ {printf "KERBEROS:%s\n",$1}' $prefix.extra > extra.foreign
-blanche afs-foreign-users -f extra.foreign
-awk '/^[^ ][^:@]*$/ {printf "KERBEROS:%s\n",$1}' $prefix.extra > extra.domestic
-echo "LIST:afs-foreign-users" >> extra.domestic
-blanche afs-odd-entities -f extra.domestic
-
-####   WAIT for the above afs.incr events to take place (see moira.log)
-touch /moira/afs/noafs
-/moira/bin/afssync $prefix.moira >& $prefix.afssync.err &
-       # repeat as necessary:
-$u $db[2]; rcp root@$db[2]\:/usr/afs/db/prdb.DB0 $prefix.old; $u $db[2]
-/moira/bin/pt_util -x -m -u -g -d $prefix.extra -p $prefix.old
-perl /moira/bin/pt_util.pl < $prefix.extra > $prefix.extra.sort
-wait
-more $prefix.afssync.err
-cp $prefix.moira $prefix.new
-/moira/bin/pt_util -w -d $prefix.extra.sort -p $prefix.new >& $prefix.extra.err
-       # and review $prefix.extra.err
-
-pts listmax > $prefix.listmax
-set dbdir=/usr/afs/db
-foreach i ( $db )
-    echo "$i..."
-    rcp -px $prefix.new ${i}:$dbdir
-end
-foreach i ( $db )
-    bos shutdown $i ptserver
-    bos exec $i "rm $dbdir/prdb.DB*; mv $dbdir/prdb.new $dbdir/prdb.DB0"
-end
-foreach i ( $db )
-    bos restart $i ptserver
-end
-
-       # checks, etc:
-$u $db[1]
-
-######## more on checks
-
-rm /moira/afs/noafs
This page took 0.052923 seconds and 4 git commands to generate.