LCOV - differential code coverage report
Current view: top level - src/backend/access/spgist - spgtextproc.c (source / functions) Coverage Total Hit UBC GBC GNC CBC DCB
Current: Differential Code Coverage 16@8cea358b128 vs 17@8cea358b128 Lines: 96.2 % 291 280 11 1 1 278 1
Current Date: 2024-04-14 14:21:10 Functions: 100.0 % 9 9 1 8
Baseline: 16@8cea358b128 Branches: 51.6 % 341 176 165 1 175
Baseline Date: 2024-04-14 14:21:09 Line coverage date bins:
Legend: Lines: hit not hit | Branches: + taken - not taken # not executed [..60] days: 100.0 % 1 1 1
(240..) days: 96.2 % 290 279 11 1 278
Function coverage date bins:
(240..) days: 100.0 % 9 9 1 8
Branch coverage date bins:
(240..) days: 51.6 % 341 176 165 1 175

 Age         Owner                    Branch data    TLA  Line data    Source code
                                  1                 :                : /*-------------------------------------------------------------------------
                                  2                 :                :  *
                                  3                 :                :  * spgtextproc.c
                                  4                 :                :  *    implementation of radix tree (compressed trie) over text
                                  5                 :                :  *
                                  6                 :                :  * In a text_ops SPGiST index, inner tuples can have a prefix which is the
                                  7                 :                :  * common prefix of all strings indexed under that tuple.  The node labels
                                  8                 :                :  * represent the next byte of the string(s) after the prefix.  Assuming we
                                  9                 :                :  * always use the longest possible prefix, we will get more than one node
                                 10                 :                :  * label unless the prefix length is restricted by SPGIST_MAX_PREFIX_LENGTH.
                                 11                 :                :  *
                                 12                 :                :  * To reconstruct the indexed string for any index entry, concatenate the
                                 13                 :                :  * inner-tuple prefixes and node labels starting at the root and working
                                 14                 :                :  * down to the leaf entry, then append the datum in the leaf entry.
                                 15                 :                :  * (While descending the tree, "level" is the number of bytes reconstructed
                                 16                 :                :  * so far.)
                                 17                 :                :  *
                                 18                 :                :  * However, there are two special cases for node labels: -1 indicates that
                                 19                 :                :  * there are no more bytes after the prefix-so-far, and -2 indicates that we
                                 20                 :                :  * had to split an existing allTheSame tuple (in such a case we have to create
                                 21                 :                :  * a node label that doesn't correspond to any string byte).  In either case,
                                 22                 :                :  * the node label does not contribute anything to the reconstructed string.
                                 23                 :                :  *
                                 24                 :                :  * Previously, we used a node label of zero for both special cases, but
                                 25                 :                :  * this was problematic because one can't tell whether a string ending at
                                 26                 :                :  * the current level can be pushed down into such a child node.  For
                                 27                 :                :  * backwards compatibility, we still support such node labels for reading;
                                 28                 :                :  * but no new entries will ever be pushed down into a zero-labeled child.
                                 29                 :                :  * No new entries ever get pushed into a -2-labeled child, either.
                                 30                 :                :  *
                                 31                 :                :  *
                                 32                 :                :  * Portions Copyright (c) 1996-2024, PostgreSQL Global Development Group
                                 33                 :                :  * Portions Copyright (c) 1994, Regents of the University of California
                                 34                 :                :  *
                                 35                 :                :  * IDENTIFICATION
                                 36                 :                :  *          src/backend/access/spgist/spgtextproc.c
                                 37                 :                :  *
                                 38                 :                :  *-------------------------------------------------------------------------
                                 39                 :                :  */
                                 40                 :                : #include "postgres.h"
                                 41                 :                : 
                                 42                 :                : #include "access/spgist.h"
                                 43                 :                : #include "catalog/pg_type.h"
                                 44                 :                : #include "common/int.h"
                                 45                 :                : #include "mb/pg_wchar.h"
                                 46                 :                : #include "utils/datum.h"
                                 47                 :                : #include "utils/fmgrprotos.h"
                                 48                 :                : #include "utils/pg_locale.h"
                                 49                 :                : #include "utils/varlena.h"
                                 50                 :                : #include "varatt.h"
                                 51                 :                : 
                                 52                 :                : 
                                 53                 :                : /*
                                 54                 :                :  * In the worst case, an inner tuple in a text radix tree could have as many
                                 55                 :                :  * as 258 nodes (one for each possible byte value, plus the two special
                                 56                 :                :  * cases).  Each node can take 16 bytes on MAXALIGN=8 machines.  The inner
                                 57                 :                :  * tuple must fit on an index page of size BLCKSZ.  Rather than assuming we
                                 58                 :                :  * know the exact amount of overhead imposed by page headers, tuple headers,
                                 59                 :                :  * etc, we leave 100 bytes for that (the actual overhead should be no more
                                 60                 :                :  * than 56 bytes at this writing, so there is slop in this number).
                                 61                 :                :  * So we can safely create prefixes up to BLCKSZ - 258 * 16 - 100 bytes long.
                                 62                 :                :  * Unfortunately, because 258 * 16 is over 4K, there is no safe prefix length
                                 63                 :                :  * when BLCKSZ is less than 8K; it is always possible to get "SPGiST inner
                                 64                 :                :  * tuple size exceeds maximum" if there are too many distinct next-byte values
                                 65                 :                :  * at a given place in the tree.  Since use of nonstandard block sizes appears
                                 66                 :                :  * to be negligible in the field, we just live with that fact for now,
                                 67                 :                :  * choosing a max prefix size of 32 bytes when BLCKSZ is configured smaller
                                 68                 :                :  * than default.
                                 69                 :                :  */
                                 70                 :                : #define SPGIST_MAX_PREFIX_LENGTH    Max((int) (BLCKSZ - 258 * 16 - 100), 32)
                                 71                 :                : 
                                 72                 :                : /*
                                 73                 :                :  * Strategy for collation aware operator on text is equal to btree strategy
                                 74                 :                :  * plus value of 10.
                                 75                 :                :  *
                                 76                 :                :  * Current collation aware strategies and their corresponding btree strategies:
                                 77                 :                :  * 11 BTLessStrategyNumber
                                 78                 :                :  * 12 BTLessEqualStrategyNumber
                                 79                 :                :  * 14 BTGreaterEqualStrategyNumber
                                 80                 :                :  * 15 BTGreaterStrategyNumber
                                 81                 :                :  */
                                 82                 :                : #define SPG_STRATEGY_ADDITION   (10)
                                 83                 :                : #define SPG_IS_COLLATION_AWARE_STRATEGY(s) ((s) > SPG_STRATEGY_ADDITION \
                                 84                 :                :                                          && (s) != RTPrefixStrategyNumber)
                                 85                 :                : 
                                 86                 :                : /* Struct for sorting values in picksplit */
                                 87                 :                : typedef struct spgNodePtr
                                 88                 :                : {
                                 89                 :                :     Datum       d;
                                 90                 :                :     int         i;
                                 91                 :                :     int16       c;
                                 92                 :                : } spgNodePtr;
                                 93                 :                : 
                                 94                 :                : 
                                 95                 :                : Datum
 4502 tgl@sss.pgh.pa.us          96                 :CBC          42 : spg_text_config(PG_FUNCTION_ARGS)
                                 97                 :                : {
                                 98                 :                :     /* spgConfigIn *cfgin = (spgConfigIn *) PG_GETARG_POINTER(0); */
                                 99                 :             42 :     spgConfigOut *cfg = (spgConfigOut *) PG_GETARG_POINTER(1);
                                100                 :                : 
                                101                 :             42 :     cfg->prefixType = TEXTOID;
 3597                           102                 :             42 :     cfg->labelType = INT2OID;
 4500                           103                 :             42 :     cfg->canReturnData = true;
 4502                           104                 :             42 :     cfg->longValuesOK = true;    /* suffixing will shorten long values */
                                105                 :             42 :     PG_RETURN_VOID();
                                106                 :                : }
                                107                 :                : 
                                108                 :                : /*
                                109                 :                :  * Form a text datum from the given not-necessarily-null-terminated string,
                                110                 :                :  * using short varlena header format if possible
                                111                 :                :  */
                                112                 :                : static Datum
                                113                 :         129336 : formTextDatum(const char *data, int datalen)
                                114                 :                : {
                                115                 :                :     char       *p;
                                116                 :                : 
                                117                 :         129336 :     p = (char *) palloc(datalen + VARHDRSZ);
                                118                 :                : 
                                119         [ +  - ]:         129336 :     if (datalen + VARHDRSZ_SHORT <= VARATT_SHORT_MAX)
                                120                 :                :     {
                                121                 :         129336 :         SET_VARSIZE_SHORT(p, datalen + VARHDRSZ_SHORT);
                                122         [ +  + ]:         129336 :         if (datalen)
                                123                 :         121512 :             memcpy(p + VARHDRSZ_SHORT, data, datalen);
                                124                 :                :     }
                                125                 :                :     else
                                126                 :                :     {
 4502 tgl@sss.pgh.pa.us         127                 :UBC           0 :         SET_VARSIZE(p, datalen + VARHDRSZ);
                                128                 :              0 :         memcpy(p + VARHDRSZ, data, datalen);
                                129                 :                :     }
                                130                 :                : 
 4502 tgl@sss.pgh.pa.us         131                 :CBC      129336 :     return PointerGetDatum(p);
                                132                 :                : }
                                133                 :                : 
                                134                 :                : /*
                                135                 :                :  * Find the length of the common prefix of a and b
                                136                 :                :  */
                                137                 :                : static int
                                138                 :          47646 : commonPrefix(const char *a, const char *b, int lena, int lenb)
                                139                 :                : {
                                140                 :          47646 :     int         i = 0;
                                141                 :                : 
                                142   [ +  +  +  +  :        3318873 :     while (i < lena && i < lenb && *a == *b)
                                              +  + ]
                                143                 :                :     {
                                144                 :        3271227 :         a++;
                                145                 :        3271227 :         b++;
                                146                 :        3271227 :         i++;
                                147                 :                :     }
                                148                 :                : 
                                149                 :          47646 :     return i;
                                150                 :                : }
                                151                 :                : 
                                152                 :                : /*
                                153                 :                :  * Binary search an array of int16 datums for a match to c
                                154                 :                :  *
                                155                 :                :  * On success, *i gets the match location; on failure, it gets where to insert
                                156                 :                :  */
                                157                 :                : static bool
 3597                           158                 :         104409 : searchChar(Datum *nodeLabels, int nNodes, int16 c, int *i)
                                159                 :                : {
 4502                           160                 :         104409 :     int         StopLow = 0,
                                161                 :         104409 :                 StopHigh = nNodes;
                                162                 :                : 
                                163         [ +  + ]:         286570 :     while (StopLow < StopHigh)
                                164                 :                :     {
                                165                 :         285887 :         int         StopMiddle = (StopLow + StopHigh) >> 1;
 3597                           166                 :         285887 :         int16       middle = DatumGetInt16(nodeLabels[StopMiddle]);
                                167                 :                : 
 4502                           168         [ +  + ]:         285887 :         if (c < middle)
                                169                 :          90453 :             StopHigh = StopMiddle;
                                170         [ +  + ]:         195434 :         else if (c > middle)
                                171                 :          91708 :             StopLow = StopMiddle + 1;
                                172                 :                :         else
                                173                 :                :         {
                                174                 :         103726 :             *i = StopMiddle;
                                175                 :         103726 :             return true;
                                176                 :                :         }
                                177                 :                :     }
                                178                 :                : 
                                179                 :            683 :     *i = StopHigh;
                                180                 :            683 :     return false;
                                181                 :                : }
                                182                 :                : 
                                183                 :                : Datum
                                184                 :         104723 : spg_text_choose(PG_FUNCTION_ARGS)
                                185                 :                : {
                                186                 :         104723 :     spgChooseIn *in = (spgChooseIn *) PG_GETARG_POINTER(0);
                                187                 :         104723 :     spgChooseOut *out = (spgChooseOut *) PG_GETARG_POINTER(1);
                                188                 :         104723 :     text       *inText = DatumGetTextPP(in->datum);
                                189         [ +  - ]:         104723 :     char       *inStr = VARDATA_ANY(inText);
                                190   [ -  +  -  -  :         104723 :     int         inSize = VARSIZE_ANY_EXHDR(inText);
                                     -  -  -  -  +  
                                                 - ]
 3597                           191                 :         104723 :     char       *prefixStr = NULL;
                                192                 :         104723 :     int         prefixSize = 0;
 4502                           193                 :         104723 :     int         commonLen = 0;
 3597                           194                 :         104723 :     int16       nodeChar = 0;
                                195                 :         104723 :     int         i = 0;
                                196                 :                : 
                                197                 :                :     /* Check for prefix match, set nodeChar to first byte after prefix */
 4502                           198         [ +  + ]:         104723 :     if (in->hasPrefix)
                                199                 :                :     {
                                200                 :          41410 :         text       *prefixText = DatumGetTextPP(in->prefixDatum);
                                201                 :                : 
 3597                           202         [ +  - ]:          41410 :         prefixStr = VARDATA_ANY(prefixText);
                                203   [ -  +  -  -  :          41410 :         prefixSize = VARSIZE_ANY_EXHDR(prefixText);
                                     -  -  -  -  +  
                                                 - ]
                                204                 :                : 
 4502                           205                 :          41410 :         commonLen = commonPrefix(inStr + in->level,
                                206                 :                :                                  prefixStr,
                                207                 :          41410 :                                  inSize - in->level,
                                208                 :                :                                  prefixSize);
                                209                 :                : 
                                210         [ +  + ]:          41410 :         if (commonLen == prefixSize)
                                211                 :                :         {
                                212         [ +  + ]:          41096 :             if (inSize - in->level > commonLen)
 3597                           213                 :          38018 :                 nodeChar = *(unsigned char *) (inStr + in->level + commonLen);
                                214                 :                :             else
                                215                 :           3078 :                 nodeChar = -1;
                                216                 :                :         }
                                217                 :                :         else
                                218                 :                :         {
                                219                 :                :             /* Must split tuple because incoming value doesn't match prefix */
 4502                           220                 :            314 :             out->resultType = spgSplitTuple;
                                221                 :                : 
                                222         [ +  + ]:            314 :             if (commonLen == 0)
                                223                 :                :             {
                                224                 :             11 :                 out->result.splitTuple.prefixHasPrefix = false;
                                225                 :                :             }
                                226                 :                :             else
                                227                 :                :             {
                                228                 :            303 :                 out->result.splitTuple.prefixHasPrefix = true;
                                229                 :            303 :                 out->result.splitTuple.prefixPrefixDatum =
                                230                 :            303 :                     formTextDatum(prefixStr, commonLen);
                                231                 :                :             }
 2791                           232                 :            314 :             out->result.splitTuple.prefixNNodes = 1;
                                233                 :            314 :             out->result.splitTuple.prefixNodeLabels =
                                234                 :            314 :                 (Datum *) palloc(sizeof(Datum));
                                235                 :            628 :             out->result.splitTuple.prefixNodeLabels[0] =
 3597                           236                 :            314 :                 Int16GetDatum(*(unsigned char *) (prefixStr + commonLen));
                                237                 :                : 
 2791                           238                 :            314 :             out->result.splitTuple.childNodeN = 0;
                                239                 :                : 
 4502                           240         [ +  + ]:            314 :             if (prefixSize - commonLen == 1)
                                241                 :                :             {
                                242                 :            308 :                 out->result.splitTuple.postfixHasPrefix = false;
                                243                 :                :             }
                                244                 :                :             else
                                245                 :                :             {
                                246                 :              6 :                 out->result.splitTuple.postfixHasPrefix = true;
                                247                 :              6 :                 out->result.splitTuple.postfixPrefixDatum =
                                248                 :              6 :                     formTextDatum(prefixStr + commonLen + 1,
                                249                 :              6 :                                   prefixSize - commonLen - 1);
                                250                 :                :             }
                                251                 :                : 
                                252                 :            314 :             PG_RETURN_VOID();
                                253                 :                :         }
                                254                 :                :     }
                                255         [ +  + ]:          63313 :     else if (inSize > in->level)
                                256                 :                :     {
 3597                           257                 :          62763 :         nodeChar = *(unsigned char *) (inStr + in->level);
                                258                 :                :     }
                                259                 :                :     else
                                260                 :                :     {
                                261                 :            550 :         nodeChar = -1;
                                262                 :                :     }
                                263                 :                : 
                                264                 :                :     /* Look up nodeChar in the node label array */
 4502                           265         [ +  + ]:         104409 :     if (searchChar(in->nodeLabels, in->nNodes, nodeChar, &i))
                                266                 :                :     {
                                267                 :                :         /*
                                268                 :                :          * Descend to existing node.  (If in->allTheSame, the core code will
                                269                 :                :          * ignore our nodeN specification here, but that's OK.  We still have
                                270                 :                :          * to provide the correct levelAdd and restDatum values, and those are
                                271                 :                :          * the same regardless of which node gets chosen by core.)
                                272                 :                :          */
                                273                 :                :         int         levelAdd;
                                274                 :                : 
                                275                 :         103726 :         out->resultType = spgMatchNode;
                                276                 :         103726 :         out->result.matchNode.nodeN = i;
 3597                           277                 :         103726 :         levelAdd = commonLen;
                                278         [ +  + ]:         103726 :         if (nodeChar >= 0)
                                279                 :         100101 :             levelAdd++;
                                280                 :         103726 :         out->result.matchNode.levelAdd = levelAdd;
                                281         [ +  + ]:         103726 :         if (inSize - in->level - levelAdd > 0)
 4502                           282                 :         100098 :             out->result.matchNode.restDatum =
 3597                           283                 :         100098 :                 formTextDatum(inStr + in->level + levelAdd,
                                284                 :         100098 :                               inSize - in->level - levelAdd);
                                285                 :                :         else
 4502                           286                 :           3628 :             out->result.matchNode.restDatum =
                                287                 :           3628 :                 formTextDatum(NULL, 0);
                                288                 :                :     }
                                289         [ +  + ]:            683 :     else if (in->allTheSame)
                                290                 :                :     {
                                291                 :                :         /*
                                292                 :                :          * Can't use AddNode action, so split the tuple.  The upper tuple has
                                293                 :                :          * the same prefix as before and uses a dummy node label -2 for the
                                294                 :                :          * lower tuple.  The lower tuple has no prefix and the same node
                                295                 :                :          * labels as the original tuple.
                                296                 :                :          *
                                297                 :                :          * Note: it might seem tempting to shorten the upper tuple's prefix,
                                298                 :                :          * if it has one, then use its last byte as label for the lower tuple.
                                299                 :                :          * But that doesn't win since we know the incoming value matches the
                                300                 :                :          * whole prefix: we'd just end up splitting the lower tuple again.
                                301                 :                :          */
                                302                 :              3 :         out->resultType = spgSplitTuple;
                                303                 :              3 :         out->result.splitTuple.prefixHasPrefix = in->hasPrefix;
                                304                 :              3 :         out->result.splitTuple.prefixPrefixDatum = in->prefixDatum;
 2791                           305                 :              3 :         out->result.splitTuple.prefixNNodes = 1;
                                306                 :              3 :         out->result.splitTuple.prefixNodeLabels = (Datum *) palloc(sizeof(Datum));
                                307                 :              3 :         out->result.splitTuple.prefixNodeLabels[0] = Int16GetDatum(-2);
                                308                 :              3 :         out->result.splitTuple.childNodeN = 0;
 4502                           309                 :              3 :         out->result.splitTuple.postfixHasPrefix = false;
                                310                 :                :     }
                                311                 :                :     else
                                312                 :                :     {
                                313                 :                :         /* Add a node for the not-previously-seen nodeChar value */
                                314                 :            680 :         out->resultType = spgAddNode;
 3597                           315                 :            680 :         out->result.addNode.nodeLabel = Int16GetDatum(nodeChar);
 4502                           316                 :            680 :         out->result.addNode.nodeN = i;
                                317                 :                :     }
                                318                 :                : 
                                319                 :         104409 :     PG_RETURN_VOID();
                                320                 :                : }
                                321                 :                : 
                                322                 :                : /* qsort comparator to sort spgNodePtr structs by "c" */
                                323                 :                : static int
                                324                 :          58070 : cmpNodePtr(const void *a, const void *b)
                                325                 :                : {
                                326                 :          58070 :     const spgNodePtr *aa = (const spgNodePtr *) a;
                                327                 :          58070 :     const spgNodePtr *bb = (const spgNodePtr *) b;
                                328                 :                : 
   58 nathan@postgresql.or      329                 :GNC       58070 :     return pg_cmp_s16(aa->c, bb->c);
                                330                 :                : }
                                331                 :                : 
                                332                 :                : Datum
 4502 tgl@sss.pgh.pa.us         333                 :CBC         260 : spg_text_picksplit(PG_FUNCTION_ARGS)
                                334                 :                : {
                                335                 :            260 :     spgPickSplitIn *in = (spgPickSplitIn *) PG_GETARG_POINTER(0);
                                336                 :            260 :     spgPickSplitOut *out = (spgPickSplitOut *) PG_GETARG_POINTER(1);
                                337                 :            260 :     text       *text0 = DatumGetTextPP(in->datums[0]);
                                338                 :                :     int         i,
                                339                 :                :                 commonLen;
                                340                 :                :     spgNodePtr *nodes;
                                341                 :                : 
                                342                 :                :     /* Identify longest common prefix, if any */
                                343   [ -  +  -  -  :            260 :     commonLen = VARSIZE_ANY_EXHDR(text0);
                                     -  -  -  -  +  
                                                 - ]
                                344   [ +  +  +  + ]:           6496 :     for (i = 1; i < in->nTuples && commonLen > 0; i++)
                                345                 :                :     {
                                346                 :           6236 :         text       *texti = DatumGetTextPP(in->datums[i]);
                                347         [ +  - ]:          18708 :         int         tmp = commonPrefix(VARDATA_ANY(text0),
                                348         [ +  - ]:           6236 :                                        VARDATA_ANY(texti),
                                349   [ -  +  -  -  :           6236 :                                        VARSIZE_ANY_EXHDR(text0),
                                     -  -  -  -  +  
                                                 - ]
                                350   [ -  +  -  -  :           6236 :                                        VARSIZE_ANY_EXHDR(texti));
                                     -  -  -  -  +  
                                                 - ]
                                351                 :                : 
                                352         [ +  + ]:           6236 :         if (tmp < commonLen)
                                353                 :            208 :             commonLen = tmp;
                                354                 :                :     }
                                355                 :                : 
                                356                 :                :     /*
                                357                 :                :      * Limit the prefix length, if necessary, to ensure that the resulting
                                358                 :                :      * inner tuple will fit on a page.
                                359                 :                :      */
                                360                 :            260 :     commonLen = Min(commonLen, SPGIST_MAX_PREFIX_LENGTH);
                                361                 :                : 
                                362                 :                :     /* Set node prefix to be that string, if it's not empty */
                                363         [ +  + ]:            260 :     if (commonLen == 0)
                                364                 :                :     {
                                365                 :            215 :         out->hasPrefix = false;
                                366                 :                :     }
                                367                 :                :     else
                                368                 :                :     {
                                369                 :             45 :         out->hasPrefix = true;
                                370         [ +  - ]:             45 :         out->prefixDatum = formTextDatum(VARDATA_ANY(text0), commonLen);
                                371                 :                :     }
                                372                 :                : 
                                373                 :                :     /* Extract the node label (first non-common byte) from each value */
                                374                 :            260 :     nodes = (spgNodePtr *) palloc(sizeof(spgNodePtr) * in->nTuples);
                                375                 :                : 
                                376         [ +  + ]:          25516 :     for (i = 0; i < in->nTuples; i++)
                                377                 :                :     {
                                378                 :          25256 :         text       *texti = DatumGetTextPP(in->datums[i]);
                                379                 :                : 
                                380   [ -  +  -  -  :          25256 :         if (commonLen < VARSIZE_ANY_EXHDR(texti))
                                     -  -  -  -  +  
                                           -  +  + ]
 3597                           381         [ +  - ]:          21924 :             nodes[i].c = *(unsigned char *) (VARDATA_ANY(texti) + commonLen);
                                382                 :                :         else
                                383                 :           3332 :             nodes[i].c = -1;    /* use -1 if string is all common */
 4502                           384                 :          25256 :         nodes[i].i = i;
                                385                 :          25256 :         nodes[i].d = in->datums[i];
                                386                 :                :     }
                                387                 :                : 
                                388                 :                :     /*
                                389                 :                :      * Sort by label values so that we can group the values into nodes.  This
                                390                 :                :      * also ensures that the nodes are ordered by label value, allowing the
                                391                 :                :      * use of binary search in searchChar.
                                392                 :                :      */
                                393                 :            260 :     qsort(nodes, in->nTuples, sizeof(*nodes), cmpNodePtr);
                                394                 :                : 
                                395                 :                :     /* And emit results */
                                396                 :            260 :     out->nNodes = 0;
                                397                 :            260 :     out->nodeLabels = (Datum *) palloc(sizeof(Datum) * in->nTuples);
                                398                 :            260 :     out->mapTuplesToNodes = (int *) palloc(sizeof(int) * in->nTuples);
                                399                 :            260 :     out->leafTupleDatums = (Datum *) palloc(sizeof(Datum) * in->nTuples);
                                400                 :                : 
                                401         [ +  + ]:          25516 :     for (i = 0; i < in->nTuples; i++)
                                402                 :                :     {
                                403                 :          25256 :         text       *texti = DatumGetTextPP(nodes[i].d);
                                404                 :                :         Datum       leafD;
                                405                 :                : 
                                406   [ +  +  +  + ]:          25256 :         if (i == 0 || nodes[i].c != nodes[i - 1].c)
                                407                 :                :         {
 3597                           408                 :           1625 :             out->nodeLabels[out->nNodes] = Int16GetDatum(nodes[i].c);
 4502                           409                 :           1625 :             out->nNodes++;
                                410                 :                :         }
                                411                 :                : 
                                412   [ -  +  -  -  :          25256 :         if (commonLen < VARSIZE_ANY_EXHDR(texti))
                                     -  -  -  -  +  
                                           -  +  + ]
 4502 tgl@sss.pgh.pa.us         413                 :UBC           0 :             leafD = formTextDatum(VARDATA_ANY(texti) + commonLen + 1,
 4502 tgl@sss.pgh.pa.us         414   [ -  +  -  -  :CBC       21924 :                                   VARSIZE_ANY_EXHDR(texti) - commonLen - 1);
                                     -  -  -  -  +  
                                           -  +  - ]
                                415                 :                :         else
                                416                 :           3332 :             leafD = formTextDatum(NULL, 0);
                                417                 :                : 
                                418                 :          25256 :         out->leafTupleDatums[nodes[i].i] = leafD;
                                419                 :          25256 :         out->mapTuplesToNodes[nodes[i].i] = out->nNodes - 1;
                                420                 :                :     }
                                421                 :                : 
                                422                 :            260 :     PG_RETURN_VOID();
                                423                 :                : }
                                424                 :                : 
                                425                 :                : Datum
                                426                 :            890 : spg_text_inner_consistent(PG_FUNCTION_ARGS)
                                427                 :                : {
                                428                 :            890 :     spgInnerConsistentIn *in = (spgInnerConsistentIn *) PG_GETARG_POINTER(0);
                                429                 :            890 :     spgInnerConsistentOut *out = (spgInnerConsistentOut *) PG_GETARG_POINTER(1);
 4418                           430                 :            890 :     bool        collate_is_c = lc_collate_is_c(PG_GET_COLLATION());
                                431                 :                :     text       *reconstructedValue;
                                432                 :                :     text       *reconstrText;
                                433                 :                :     int         maxReconstrLen;
 4502                           434                 :            890 :     text       *prefixText = NULL;
                                435                 :            890 :     int         prefixSize = 0;
                                436                 :                :     int         i;
                                437                 :                : 
                                438                 :                :     /*
                                439                 :                :      * Reconstruct values represented at this tuple, including parent data,
                                440                 :                :      * prefix of this tuple if any, and the node label if it's non-dummy.
                                441                 :                :      * in->level should be the length of the previously reconstructed value,
                                442                 :                :      * and the number of bytes added here is prefixSize or prefixSize + 1.
                                443                 :                :      *
                                444                 :                :      * Note: we assume that in->reconstructedValue isn't toasted and doesn't
                                445                 :                :      * have a short varlena header.  This is okay because it must have been
                                446                 :                :      * created by a previous invocation of this routine, and we always emit
                                447                 :                :      * long-format reconstructed values.
                                448                 :                :      */
 3025                           449                 :            890 :     reconstructedValue = (text *) DatumGetPointer(in->reconstructedValue);
                                450   [ +  +  -  +  :            890 :     Assert(reconstructedValue == NULL ? in->level == 0 :
                                     -  -  -  -  -  
                                        -  -  +  -  
                                                 + ]
                                451                 :                :            VARSIZE_ANY_EXHDR(reconstructedValue) == in->level);
                                452                 :                : 
 4502                           453                 :            890 :     maxReconstrLen = in->level + 1;
                                454         [ +  + ]:            890 :     if (in->hasPrefix)
                                455                 :                :     {
                                456                 :            162 :         prefixText = DatumGetTextPP(in->prefixDatum);
                                457   [ -  +  -  -  :            162 :         prefixSize = VARSIZE_ANY_EXHDR(prefixText);
                                     -  -  -  -  +  
                                                 - ]
                                458                 :            162 :         maxReconstrLen += prefixSize;
                                459                 :                :     }
                                460                 :                : 
                                461                 :            890 :     reconstrText = palloc(VARHDRSZ + maxReconstrLen);
                                462                 :            890 :     SET_VARSIZE(reconstrText, VARHDRSZ + maxReconstrLen);
                                463                 :                : 
                                464         [ +  + ]:            890 :     if (in->level)
                                465                 :            800 :         memcpy(VARDATA(reconstrText),
 3025                           466                 :            800 :                VARDATA(reconstructedValue),
 4502                           467                 :            800 :                in->level);
                                468         [ +  + ]:            890 :     if (prefixSize)
 4502 tgl@sss.pgh.pa.us         469                 :UBC           0 :         memcpy(((char *) VARDATA(reconstrText)) + in->level,
 4502 tgl@sss.pgh.pa.us         470         [ +  - ]:CBC         162 :                VARDATA_ANY(prefixText),
                                471                 :                :                prefixSize);
                                472                 :                :     /* last byte of reconstrText will be filled in below */
                                473                 :                : 
                                474                 :                :     /*
                                475                 :                :      * Scan the child nodes.  For each one, complete the reconstructed value
                                476                 :                :      * and see if it's consistent with the query.  If so, emit an entry into
                                477                 :                :      * the output arrays.
                                478                 :                :      */
                                479                 :            890 :     out->nodeNumbers = (int *) palloc(sizeof(int) * in->nNodes);
                                480                 :            890 :     out->levelAdds = (int *) palloc(sizeof(int) * in->nNodes);
                                481                 :            890 :     out->reconstructedValues = (Datum *) palloc(sizeof(Datum) * in->nNodes);
                                482                 :            890 :     out->nNodes = 0;
                                483                 :                : 
                                484         [ +  + ]:           9368 :     for (i = 0; i < in->nNodes; i++)
                                485                 :                :     {
 3597                           486                 :           8478 :         int16       nodeChar = DatumGetInt16(in->nodeLabels[i]);
                                487                 :                :         int         thisLen;
 4418                           488                 :           8478 :         bool        res = true;
                                489                 :                :         int         j;
                                490                 :                : 
                                491                 :                :         /* If nodeChar is a dummy value, don't include it in data */
 3597                           492         [ +  + ]:           8478 :         if (nodeChar <= 0)
 4502                           493                 :           1854 :             thisLen = maxReconstrLen - 1;
                                494                 :                :         else
                                495                 :                :         {
 3597                           496                 :           6624 :             ((unsigned char *) VARDATA(reconstrText))[maxReconstrLen - 1] = nodeChar;
 4502                           497                 :           6624 :             thisLen = maxReconstrLen;
                                498                 :                :         }
                                499                 :                : 
 4418                           500         [ +  + ]:          14706 :         for (j = 0; j < in->nkeys; j++)
                                501                 :                :         {
                                502                 :           8478 :             StrategyNumber strategy = in->scankeys[j].sk_strategy;
                                503                 :                :             text       *inText;
                                504                 :                :             int         inSize;
                                505                 :                :             int         r;
                                506                 :                : 
                                507                 :                :             /*
                                508                 :                :              * If it's a collation-aware operator, but the collation is C, we
                                509                 :                :              * can treat it as non-collation-aware.  With non-C collation we
                                510                 :                :              * need to traverse whole tree :-( so there's no point in making
                                511                 :                :              * any check here.  (Note also that our reconstructed value may
                                512                 :                :              * well end with a partial multibyte character, so that applying
                                513                 :                :              * any encoding-sensitive test to it would be risky anyhow.)
                                514                 :                :              */
 2203 teodor@sigaev.ru          515   [ +  +  +  + ]:           8478 :             if (SPG_IS_COLLATION_AWARE_STRATEGY(strategy))
                                516                 :                :             {
 4418 tgl@sss.pgh.pa.us         517         [ +  + ]:           5336 :                 if (collate_is_c)
 2203 teodor@sigaev.ru          518                 :GBC         312 :                     strategy -= SPG_STRATEGY_ADDITION;
                                519                 :                :                 else
 4418 tgl@sss.pgh.pa.us         520                 :CBC        5024 :                     continue;
                                521                 :                :             }
                                522                 :                : 
                                523                 :           3454 :             inText = DatumGetTextPP(in->scankeys[j].sk_argument);
                                524   [ -  +  -  -  :           3454 :             inSize = VARSIZE_ANY_EXHDR(inText);
                                     -  -  -  -  -  
                                                 + ]
                                525                 :                : 
 4418 tgl@sss.pgh.pa.us         526                 :UBC           0 :             r = memcmp(VARDATA(reconstrText), VARDATA_ANY(inText),
 4418 tgl@sss.pgh.pa.us         527         [ -  + ]:CBC        3454 :                        Min(inSize, thisLen));
                                528                 :                : 
                                529   [ +  +  +  +  :           3454 :             switch (strategy)
                                                 - ]
                                530                 :                :             {
                                531                 :            704 :                 case BTLessStrategyNumber:
                                532                 :                :                 case BTLessEqualStrategyNumber:
                                533         [ +  + ]:            704 :                     if (r > 0)
                                534                 :            400 :                         res = false;
                                535                 :            704 :                     break;
                                536                 :           1798 :                 case BTEqualStrategyNumber:
                                537   [ +  +  +  + ]:           1798 :                     if (r != 0 || inSize < thisLen)
                                538                 :           1050 :                         res = false;
                                539                 :           1798 :                     break;
                                540                 :            544 :                 case BTGreaterEqualStrategyNumber:
                                541                 :                :                 case BTGreaterStrategyNumber:
                                542         [ +  + ]:            544 :                     if (r < 0)
                                543                 :            416 :                         res = false;
                                544                 :            544 :                     break;
 2203 teodor@sigaev.ru          545                 :            408 :                 case RTPrefixStrategyNumber:
                                546         [ +  + ]:            408 :                     if (r != 0)
                                547                 :            384 :                         res = false;
                                548                 :            408 :                     break;
 4418 tgl@sss.pgh.pa.us         549                 :UBC           0 :                 default:
                                550         [ #  # ]:              0 :                     elog(ERROR, "unrecognized strategy number: %d",
                                551                 :                :                          in->scankeys[j].sk_strategy);
                                552                 :                :                     break;
                                553                 :                :             }
                                554                 :                : 
 4418 tgl@sss.pgh.pa.us         555         [ +  + ]:CBC        3454 :             if (!res)
                                556                 :           2250 :                 break;          /* no need to consider remaining conditions */
                                557                 :                :         }
                                558                 :                : 
 4502                           559         [ +  + ]:           8478 :         if (res)
                                560                 :                :         {
                                561                 :           6228 :             out->nodeNumbers[out->nNodes] = i;
                                562                 :           6228 :             out->levelAdds[out->nNodes] = thisLen - in->level;
                                563                 :           6228 :             SET_VARSIZE(reconstrText, VARHDRSZ + thisLen);
                                564                 :          12456 :             out->reconstructedValues[out->nNodes] =
                                565                 :           6228 :                 datumCopy(PointerGetDatum(reconstrText), false, -1);
                                566                 :           6228 :             out->nNodes++;
                                567                 :                :         }
                                568                 :                :     }
                                569                 :                : 
                                570                 :            890 :     PG_RETURN_VOID();
                                571                 :                : }
                                572                 :                : 
                                573                 :                : Datum
                                574                 :         117750 : spg_text_leaf_consistent(PG_FUNCTION_ARGS)
                                575                 :                : {
                                576                 :         117750 :     spgLeafConsistentIn *in = (spgLeafConsistentIn *) PG_GETARG_POINTER(0);
                                577                 :         117750 :     spgLeafConsistentOut *out = (spgLeafConsistentOut *) PG_GETARG_POINTER(1);
                                578                 :         117750 :     int         level = in->level;
                                579                 :                :     text       *leafValue,
                                580                 :         117750 :                *reconstrValue = NULL;
                                581                 :                :     char       *fullValue;
                                582                 :                :     int         fullLen;
                                583                 :                :     bool        res;
                                584                 :                :     int         j;
                                585                 :                : 
                                586                 :                :     /* all tests are exact */
                                587                 :         117750 :     out->recheck = false;
                                588                 :                : 
                                589                 :         117750 :     leafValue = DatumGetTextPP(in->leafDatum);
                                590                 :                : 
                                591                 :                :     /* As above, in->reconstructedValue isn't toasted or short. */
                                592         [ +  + ]:         117750 :     if (DatumGetPointer(in->reconstructedValue))
 2590 noah@leadboat.com         593                 :         117738 :         reconstrValue = (text *) DatumGetPointer(in->reconstructedValue);
                                594                 :                : 
 3025 tgl@sss.pgh.pa.us         595   [ +  +  -  +  :         117750 :     Assert(reconstrValue == NULL ? level == 0 :
                                     -  -  -  -  -  
                                        -  -  +  -  
                                                 + ]
                                596                 :                :            VARSIZE_ANY_EXHDR(reconstrValue) == level);
                                597                 :                : 
                                598                 :                :     /* Reconstruct the full string represented by this leaf tuple */
 4502                           599   [ -  +  -  -  :         117750 :     fullLen = level + VARSIZE_ANY_EXHDR(leafValue);
                                     -  -  -  -  +  
                                                 - ]
                                600   [ -  +  -  -  :         117750 :     if (VARSIZE_ANY_EXHDR(leafValue) == 0 && level > 0)
                                     -  -  -  -  +  
                                     -  +  +  -  -  
                                              +  - ]
                                601                 :                :     {
                                602                 :          37176 :         fullValue = VARDATA(reconstrValue);
 4500                           603                 :          37176 :         out->leafValue = PointerGetDatum(reconstrValue);
                                604                 :                :     }
                                605                 :                :     else
                                606                 :                :     {
 4326 bruce@momjian.us          607                 :          80574 :         text       *fullText = palloc(VARHDRSZ + fullLen);
                                608                 :                : 
 4500 tgl@sss.pgh.pa.us         609                 :          80574 :         SET_VARSIZE(fullText, VARHDRSZ + fullLen);
                                610                 :          80574 :         fullValue = VARDATA(fullText);
 4502                           611         [ +  + ]:          80574 :         if (level)
                                612                 :          80562 :             memcpy(fullValue, VARDATA(reconstrValue), level);
                                613   [ -  +  -  -  :          80574 :         if (VARSIZE_ANY_EXHDR(leafValue) > 0)
                                     -  -  -  -  +  
                                           -  +  - ]
                                614         [ +  - ]:          80574 :             memcpy(fullValue + level, VARDATA_ANY(leafValue),
                                615   [ -  +  -  -  :          80574 :                    VARSIZE_ANY_EXHDR(leafValue));
                                     -  -  -  -  +  
                                                 - ]
 4500                           616                 :          80574 :         out->leafValue = PointerGetDatum(fullText);
                                617                 :                :     }
                                618                 :                : 
                                619                 :                :     /* Perform the required comparison(s) */
 4418                           620                 :         117750 :     res = true;
                                621         [ +  + ]:         131523 :     for (j = 0; j < in->nkeys; j++)
                                622                 :                :     {
                                623                 :         117750 :         StrategyNumber strategy = in->scankeys[j].sk_strategy;
                                624                 :         117750 :         text       *query = DatumGetTextPP(in->scankeys[j].sk_argument);
                                625   [ -  +  -  -  :         117750 :         int         queryLen = VARSIZE_ANY_EXHDR(query);
                                     -  -  -  -  -  
                                                 + ]
                                626                 :                :         int         r;
                                627                 :                : 
 2203 teodor@sigaev.ru          628         [ +  + ]:         117750 :         if (strategy == RTPrefixStrategyNumber)
                                629                 :                :         {
                                630                 :                :             /*
                                631                 :                :              * if level >= length of query then reconstrValue must begin with
                                632                 :                :              * query (prefix) string, so we don't need to check it again.
                                633                 :                :              */
                                634   [ +  -  +  + ]:            384 :             res = (level >= queryLen) ||
 1850 peter@eisentraut.org      635                 :            192 :                 DatumGetBool(DirectFunctionCall2Coll(text_starts_with,
                                636                 :                :                                                      PG_GET_COLLATION(),
                                637                 :                :                                                      out->leafValue,
                                638                 :                :                                                      PointerGetDatum(query)));
                                639                 :                : 
 2190 tgl@sss.pgh.pa.us         640         [ +  + ]:            192 :             if (!res)           /* no need to consider remaining conditions */
 2203 teodor@sigaev.ru          641                 :            168 :                 break;
                                642                 :                : 
                                643                 :             24 :             continue;
                                644                 :                :         }
                                645                 :                : 
                                646   [ +  +  +  - ]:         117558 :         if (SPG_IS_COLLATION_AWARE_STRATEGY(strategy))
                                647                 :                :         {
                                648                 :                :             /* Collation-aware comparison */
                                649                 :         101364 :             strategy -= SPG_STRATEGY_ADDITION;
                                650                 :                : 
                                651                 :                :             /* If asserts enabled, verify encoding of reconstructed string */
 4418 tgl@sss.pgh.pa.us         652         [ -  + ]:         101364 :             Assert(pg_verifymbstr(fullValue, fullLen, false));
                                653                 :                : 
 2190 tgl@sss.pgh.pa.us         654                 :UBC           0 :             r = varstr_cmp(fullValue, fullLen,
 2190 tgl@sss.pgh.pa.us         655         [ -  + ]:CBC      101364 :                            VARDATA_ANY(query), queryLen,
                                656                 :                :                            PG_GET_COLLATION());
                                657                 :                :         }
                                658                 :                :         else
                                659                 :                :         {
                                660                 :                :             /* Non-collation-aware comparison */
 4418                           661         [ -  + ]:          16194 :             r = memcmp(fullValue, VARDATA_ANY(query), Min(queryLen, fullLen));
                                662                 :                : 
 2190                           663         [ +  + ]:          16194 :             if (r == 0)
                                664                 :                :             {
                                665         [ +  + ]:          12081 :                 if (queryLen > fullLen)
                                666                 :           6012 :                     r = -1;
                                667         [ -  + ]:           6069 :                 else if (queryLen < fullLen)
 2190 tgl@sss.pgh.pa.us         668                 :UBC           0 :                     r = 1;
                                669                 :                :             }
                                670                 :                :         }
                                671                 :                : 
 4418 tgl@sss.pgh.pa.us         672   [ +  +  +  +  :CBC      117558 :         switch (strategy)
                                              +  - ]
                                673                 :                :         {
                                674                 :          27188 :             case BTLessStrategyNumber:
                                675                 :          27188 :                 res = (r < 0);
                                676                 :          27188 :                 break;
                                677                 :          27188 :             case BTLessEqualStrategyNumber:
                                678                 :          27188 :                 res = (r <= 0);
                                679                 :          27188 :                 break;
                                680                 :          12150 :             case BTEqualStrategyNumber:
                                681                 :          12150 :                 res = (r == 0);
                                682                 :          12150 :                 break;
                                683                 :          25516 :             case BTGreaterEqualStrategyNumber:
                                684                 :          25516 :                 res = (r >= 0);
                                685                 :          25516 :                 break;
                                686                 :          25516 :             case BTGreaterStrategyNumber:
                                687                 :          25516 :                 res = (r > 0);
                                688                 :          25516 :                 break;
 4418 tgl@sss.pgh.pa.us         689                 :UBC           0 :             default:
                                690         [ #  # ]:              0 :                 elog(ERROR, "unrecognized strategy number: %d",
                                691                 :                :                      in->scankeys[j].sk_strategy);
                                692                 :                :                 res = false;
                                693                 :                :                 break;
                                694                 :                :         }
                                695                 :                : 
 4418 tgl@sss.pgh.pa.us         696         [ +  + ]:CBC      117558 :         if (!res)
                                697                 :         103809 :             break;              /* no need to consider remaining conditions */
                                698                 :                :     }
                                699                 :                : 
 4502                           700                 :         117750 :     PG_RETURN_BOOL(res);
                                701                 :                : }
        

Generated by: LCOV version 2.1-beta2-3-g6141622