LCOV - differential code coverage report
Current view: top level - src/backend/utils/adt - tsvector_op.c (source / functions) Coverage Total Hit UBC GNC CBC DCB
Current: Differential Code Coverage 16@8cea358b128 vs 17@8cea358b128 Lines: 86.4 % 1180 1020 160 1 1019 3
Current Date: 2024-04-14 14:21:10 Functions: 82.7 % 52 43 9 1 42
Baseline: 16@8cea358b128 Branches: 62.0 % 842 522 320 522
Baseline Date: 2024-04-14 14:21:09 Line coverage date bins:
Legend: Lines: hit not hit | Branches: + taken - not taken # not executed [..60] days: 100.0 % 1 1 1
(240..) days: 86.4 % 1179 1019 160 1019
Function coverage date bins:
(240..) days: 82.7 % 52 43 9 1 42
Branch coverage date bins:
(240..) days: 62.0 % 842 522 320 522

 Age         Owner                    Branch data    TLA  Line data    Source code
                                  1                 :                : /*-------------------------------------------------------------------------
                                  2                 :                :  *
                                  3                 :                :  * tsvector_op.c
                                  4                 :                :  *    operations over tsvector
                                  5                 :                :  *
                                  6                 :                :  * Portions Copyright (c) 1996-2024, PostgreSQL Global Development Group
                                  7                 :                :  *
                                  8                 :                :  *
                                  9                 :                :  * IDENTIFICATION
                                 10                 :                :  *    src/backend/utils/adt/tsvector_op.c
                                 11                 :                :  *
                                 12                 :                :  *-------------------------------------------------------------------------
                                 13                 :                :  */
                                 14                 :                : #include "postgres.h"
                                 15                 :                : 
                                 16                 :                : #include <limits.h>
                                 17                 :                : 
                                 18                 :                : #include "access/htup_details.h"
                                 19                 :                : #include "catalog/namespace.h"
                                 20                 :                : #include "catalog/pg_type.h"
                                 21                 :                : #include "commands/trigger.h"
                                 22                 :                : #include "common/int.h"
                                 23                 :                : #include "executor/spi.h"
                                 24                 :                : #include "funcapi.h"
                                 25                 :                : #include "lib/qunique.h"
                                 26                 :                : #include "mb/pg_wchar.h"
                                 27                 :                : #include "miscadmin.h"
                                 28                 :                : #include "parser/parse_coerce.h"
                                 29                 :                : #include "tsearch/ts_utils.h"
                                 30                 :                : #include "utils/array.h"
                                 31                 :                : #include "utils/builtins.h"
                                 32                 :                : #include "utils/regproc.h"
                                 33                 :                : #include "utils/rel.h"
                                 34                 :                : 
                                 35                 :                : 
                                 36                 :                : typedef struct
                                 37                 :                : {
                                 38                 :                :     WordEntry  *arrb;
                                 39                 :                :     WordEntry  *arre;
                                 40                 :                :     char       *values;
                                 41                 :                :     char       *operand;
                                 42                 :                : } CHKVAL;
                                 43                 :                : 
                                 44                 :                : 
                                 45                 :                : typedef struct StatEntry
                                 46                 :                : {
                                 47                 :                :     uint32      ndoc;           /* zero indicates that we were already here
                                 48                 :                :                                  * while walking through the tree */
                                 49                 :                :     uint32      nentry;
                                 50                 :                :     struct StatEntry *left;
                                 51                 :                :     struct StatEntry *right;
                                 52                 :                :     uint32      lenlexeme;
                                 53                 :                :     char        lexeme[FLEXIBLE_ARRAY_MEMBER];
                                 54                 :                : } StatEntry;
                                 55                 :                : 
                                 56                 :                : #define STATENTRYHDRSZ  (offsetof(StatEntry, lexeme))
                                 57                 :                : 
                                 58                 :                : typedef struct
                                 59                 :                : {
                                 60                 :                :     int32       weight;
                                 61                 :                : 
                                 62                 :                :     uint32      maxdepth;
                                 63                 :                : 
                                 64                 :                :     StatEntry **stack;
                                 65                 :                :     uint32      stackpos;
                                 66                 :                : 
                                 67                 :                :     StatEntry  *root;
                                 68                 :                : } TSVectorStat;
                                 69                 :                : 
                                 70                 :                : 
                                 71                 :                : static TSTernaryValue TS_execute_recurse(QueryItem *curitem, void *arg,
                                 72                 :                :                                          uint32 flags,
                                 73                 :                :                                          TSExecuteCallback chkcond);
                                 74                 :                : static bool TS_execute_locations_recurse(QueryItem *curitem,
                                 75                 :                :                                          void *arg,
                                 76                 :                :                                          TSExecuteCallback chkcond,
                                 77                 :                :                                          List **locations);
                                 78                 :                : static int  tsvector_bsearch(const TSVector tsv, char *lexeme, int lexeme_len);
                                 79                 :                : static Datum tsvector_update_trigger(PG_FUNCTION_ARGS, bool config_column);
                                 80                 :                : 
                                 81                 :                : 
                                 82                 :                : /*
                                 83                 :                :  * Order: haspos, len, word, for all positions (pos, weight)
                                 84                 :                :  */
                                 85                 :                : static int
 6081 tgl@sss.pgh.pa.us          86                 :CBC           1 : silly_cmp_tsvector(const TSVector a, const TSVector b)
                                 87                 :                : {
                                 88         [ -  + ]:              1 :     if (VARSIZE(a) < VARSIZE(b))
 6081 tgl@sss.pgh.pa.us          89                 :UBC           0 :         return -1;
 6081 tgl@sss.pgh.pa.us          90         [ -  + ]:CBC           1 :     else if (VARSIZE(a) > VARSIZE(b))
 6081 tgl@sss.pgh.pa.us          91                 :UBC           0 :         return 1;
 6081 tgl@sss.pgh.pa.us          92         [ -  + ]:CBC           1 :     else if (a->size < b->size)
 6081 tgl@sss.pgh.pa.us          93                 :UBC           0 :         return -1;
 6081 tgl@sss.pgh.pa.us          94         [ -  + ]:CBC           1 :     else if (a->size > b->size)
 6081 tgl@sss.pgh.pa.us          95                 :UBC           0 :         return 1;
                                 96                 :                :     else
                                 97                 :                :     {
 6081 tgl@sss.pgh.pa.us          98                 :CBC           1 :         WordEntry  *aptr = ARRPTR(a);
                                 99                 :              1 :         WordEntry  *bptr = ARRPTR(b);
                                100                 :              1 :         int         i = 0;
                                101                 :                :         int         res;
                                102                 :                : 
                                103                 :                : 
                                104         [ +  + ]:              4 :         for (i = 0; i < a->size; i++)
                                105                 :                :         {
                                106         [ -  + ]:              3 :             if (aptr->haspos != bptr->haspos)
                                107                 :                :             {
 6081 tgl@sss.pgh.pa.us         108         [ #  # ]:UBC           0 :                 return (aptr->haspos > bptr->haspos) ? -1 : 1;
                                109                 :                :             }
 5421 bruce@momjian.us          110         [ -  + ]:CBC           3 :             else if ((res = tsCompareString(STRPTR(a) + aptr->pos, aptr->len, STRPTR(b) + bptr->pos, bptr->len, false)) != 0)
                                111                 :                :             {
 6081 tgl@sss.pgh.pa.us         112                 :UBC           0 :                 return res;
                                113                 :                :             }
 6081 tgl@sss.pgh.pa.us         114         [ -  + ]:CBC           3 :             else if (aptr->haspos)
                                115                 :                :             {
 6081 tgl@sss.pgh.pa.us         116                 :UBC           0 :                 WordEntryPos *ap = POSDATAPTR(a, aptr);
                                117                 :              0 :                 WordEntryPos *bp = POSDATAPTR(b, bptr);
                                118                 :                :                 int         j;
                                119                 :                : 
                                120   [ #  #  #  #  :              0 :                 if (POSDATALEN(a, aptr) != POSDATALEN(b, bptr))
                                              #  # ]
                                121   [ #  #  #  #  :              0 :                     return (POSDATALEN(a, aptr) > POSDATALEN(b, bptr)) ? -1 : 1;
                                              #  # ]
                                122                 :                : 
                                123   [ #  #  #  # ]:              0 :                 for (j = 0; j < POSDATALEN(a, aptr); j++)
                                124                 :                :                 {
                                125         [ #  # ]:              0 :                     if (WEP_GETPOS(*ap) != WEP_GETPOS(*bp))
                                126                 :                :                     {
                                127         [ #  # ]:              0 :                         return (WEP_GETPOS(*ap) > WEP_GETPOS(*bp)) ? -1 : 1;
                                128                 :                :                     }
                                129         [ #  # ]:              0 :                     else if (WEP_GETWEIGHT(*ap) != WEP_GETWEIGHT(*bp))
                                130                 :                :                     {
                                131         [ #  # ]:              0 :                         return (WEP_GETWEIGHT(*ap) > WEP_GETWEIGHT(*bp)) ? -1 : 1;
                                132                 :                :                     }
                                133                 :              0 :                     ap++, bp++;
                                134                 :                :                 }
                                135                 :                :             }
                                136                 :                : 
 6081 tgl@sss.pgh.pa.us         137                 :CBC           3 :             aptr++;
                                138                 :              3 :             bptr++;
                                139                 :                :         }
                                140                 :                :     }
                                141                 :                : 
                                142                 :              1 :     return 0;
                                143                 :                : }
                                144                 :                : 
                                145                 :                : #define TSVECTORCMPFUNC( type, action, ret )            \
                                146                 :                : Datum                                                   \
                                147                 :                : tsvector_##type(PG_FUNCTION_ARGS)                       \
                                148                 :                : {                                                       \
                                149                 :                :     TSVector    a = PG_GETARG_TSVECTOR(0);              \
                                150                 :                :     TSVector    b = PG_GETARG_TSVECTOR(1);              \
                                151                 :                :     int         res = silly_cmp_tsvector(a, b);         \
                                152                 :                :     PG_FREE_IF_COPY(a,0);                               \
                                153                 :                :     PG_FREE_IF_COPY(b,1);                               \
                                154                 :                :     PG_RETURN_##ret( res action 0 );                    \
                                155                 :                : }   \
                                156                 :                : /* keep compiler quiet - no extra ; */                  \
                                157                 :                : extern int no_such_variable
                                158                 :                : 
 6081 tgl@sss.pgh.pa.us         159   [ #  #  #  # ]:UBC           0 : TSVECTORCMPFUNC(lt, <, BOOL);
                                160   [ #  #  #  # ]:              0 : TSVECTORCMPFUNC(le, <=, BOOL);
 6081 tgl@sss.pgh.pa.us         161   [ -  +  -  + ]:CBC           1 : TSVECTORCMPFUNC(eq, ==, BOOL);
 6081 tgl@sss.pgh.pa.us         162   [ #  #  #  # ]:UBC           0 : TSVECTORCMPFUNC(ge, >=, BOOL);
                                163   [ #  #  #  # ]:              0 : TSVECTORCMPFUNC(gt, >, BOOL);
                                164   [ #  #  #  # ]:              0 : TSVECTORCMPFUNC(ne, !=, BOOL);
                                165   [ #  #  #  # ]:              0 : TSVECTORCMPFUNC(cmp, +, INT32);
                                166                 :                : 
                                167                 :                : Datum
 6081 tgl@sss.pgh.pa.us         168                 :CBC          45 : tsvector_strip(PG_FUNCTION_ARGS)
                                169                 :                : {
                                170                 :             45 :     TSVector    in = PG_GETARG_TSVECTOR(0);
                                171                 :                :     TSVector    out;
                                172                 :                :     int         i,
                                173                 :             45 :                 len = 0;
                                174                 :             45 :     WordEntry  *arrin = ARRPTR(in),
                                175                 :                :                *arrout;
                                176                 :                :     char       *cur;
                                177                 :                : 
                                178         [ +  + ]:            159 :     for (i = 0; i < in->size; i++)
 6064 teodor@sigaev.ru          179                 :            114 :         len += arrin[i].len;
                                180                 :                : 
 6081 tgl@sss.pgh.pa.us         181                 :             45 :     len = CALCDATASIZE(in->size, len);
                                182                 :             45 :     out = (TSVector) palloc0(len);
                                183                 :             45 :     SET_VARSIZE(out, len);
                                184                 :             45 :     out->size = in->size;
                                185                 :             45 :     arrout = ARRPTR(out);
                                186                 :             45 :     cur = STRPTR(out);
                                187         [ +  + ]:            159 :     for (i = 0; i < in->size; i++)
                                188                 :                :     {
                                189                 :            114 :         memcpy(cur, STRPTR(in) + arrin[i].pos, arrin[i].len);
                                190                 :            114 :         arrout[i].haspos = 0;
                                191                 :            114 :         arrout[i].len = arrin[i].len;
                                192                 :            114 :         arrout[i].pos = cur - STRPTR(out);
 6064 teodor@sigaev.ru          193                 :            114 :         cur += arrout[i].len;
                                194                 :                :     }
                                195                 :                : 
 6081 tgl@sss.pgh.pa.us         196         [ -  + ]:             45 :     PG_FREE_IF_COPY(in, 0);
                                197                 :             45 :     PG_RETURN_POINTER(out);
                                198                 :                : }
                                199                 :                : 
                                200                 :                : Datum
                                201                 :              5 : tsvector_length(PG_FUNCTION_ARGS)
                                202                 :                : {
                                203                 :              5 :     TSVector    in = PG_GETARG_TSVECTOR(0);
 4311 peter_e@gmx.net           204                 :              5 :     int32       ret = in->size;
                                205                 :                : 
 6081 tgl@sss.pgh.pa.us         206         [ -  + ]:              5 :     PG_FREE_IF_COPY(in, 0);
                                207                 :              5 :     PG_RETURN_INT32(ret);
                                208                 :                : }
                                209                 :                : 
                                210                 :                : Datum
                                211                 :              6 : tsvector_setweight(PG_FUNCTION_ARGS)
                                212                 :                : {
                                213                 :              6 :     TSVector    in = PG_GETARG_TSVECTOR(0);
                                214                 :              6 :     char        cw = PG_GETARG_CHAR(1);
                                215                 :                :     TSVector    out;
                                216                 :                :     int         i,
                                217                 :                :                 j;
                                218                 :                :     WordEntry  *entry;
                                219                 :                :     WordEntryPos *p;
                                220                 :              6 :     int         w = 0;
                                221                 :                : 
                                222   [ -  -  +  -  :              6 :     switch (cw)
                                                 - ]
                                223                 :                :     {
 6081 tgl@sss.pgh.pa.us         224                 :UBC           0 :         case 'A':
                                225                 :                :         case 'a':
                                226                 :              0 :             w = 3;
                                227                 :              0 :             break;
                                228                 :              0 :         case 'B':
                                229                 :                :         case 'b':
                                230                 :              0 :             w = 2;
                                231                 :              0 :             break;
 6081 tgl@sss.pgh.pa.us         232                 :CBC           6 :         case 'C':
                                233                 :                :         case 'c':
                                234                 :              6 :             w = 1;
                                235                 :              6 :             break;
 6081 tgl@sss.pgh.pa.us         236                 :UBC           0 :         case 'D':
                                237                 :                :         case 'd':
                                238                 :              0 :             w = 0;
                                239                 :              0 :             break;
                                240                 :              0 :         default:
                                241                 :                :             /* internal error */
 5982                           242         [ #  # ]:              0 :             elog(ERROR, "unrecognized weight: %d", cw);
                                243                 :                :     }
                                244                 :                : 
 6081 tgl@sss.pgh.pa.us         245                 :CBC           6 :     out = (TSVector) palloc(VARSIZE(in));
                                246                 :              6 :     memcpy(out, in, VARSIZE(in));
                                247                 :              6 :     entry = ARRPTR(out);
                                248                 :              6 :     i = out->size;
                                249         [ +  + ]:             30 :     while (i--)
                                250                 :                :     {
                                251   [ +  -  +  - ]:             24 :         if ((j = POSDATALEN(out, entry)) != 0)
                                252                 :                :         {
                                253                 :             24 :             p = POSDATAPTR(out, entry);
                                254         [ +  + ]:             84 :             while (j--)
                                255                 :                :             {
                                256                 :             60 :                 WEP_SETWEIGHT(*p, w);
                                257                 :             60 :                 p++;
                                258                 :                :             }
                                259                 :                :         }
                                260                 :             24 :         entry++;
                                261                 :                :     }
                                262                 :                : 
                                263         [ -  + ]:              6 :     PG_FREE_IF_COPY(in, 0);
                                264                 :              6 :     PG_RETURN_POINTER(out);
                                265                 :                : }
                                266                 :                : 
                                267                 :                : /*
                                268                 :                :  * setweight(tsin tsvector, char_weight "char", lexemes "text"[])
                                269                 :                :  *
                                270                 :                :  * Assign weight w to elements of tsin that are listed in lexemes.
                                271                 :                :  */
                                272                 :                : Datum
 2956 teodor@sigaev.ru          273                 :             12 : tsvector_setweight_by_filter(PG_FUNCTION_ARGS)
                                274                 :                : {
                                275                 :             12 :     TSVector    tsin = PG_GETARG_TSVECTOR(0);
                                276                 :             12 :     char        char_weight = PG_GETARG_CHAR(1);
                                277                 :             12 :     ArrayType  *lexemes = PG_GETARG_ARRAYTYPE_P(2);
                                278                 :                : 
                                279                 :                :     TSVector    tsout;
                                280                 :                :     int         i,
                                281                 :                :                 j,
                                282                 :                :                 nlexemes,
                                283                 :                :                 weight;
                                284                 :                :     WordEntry  *entry;
                                285                 :                :     Datum      *dlexemes;
                                286                 :                :     bool       *nulls;
                                287                 :                : 
                                288   [ -  -  +  -  :             12 :     switch (char_weight)
                                                 - ]
                                289                 :                :     {
 2866 rhaas@postgresql.org      290                 :UBC           0 :         case 'A':
                                291                 :                :         case 'a':
 2956 teodor@sigaev.ru          292                 :              0 :             weight = 3;
                                293                 :              0 :             break;
 2866 rhaas@postgresql.org      294                 :              0 :         case 'B':
                                295                 :                :         case 'b':
 2956 teodor@sigaev.ru          296                 :              0 :             weight = 2;
                                297                 :              0 :             break;
 2866 rhaas@postgresql.org      298                 :CBC          12 :         case 'C':
                                299                 :                :         case 'c':
 2956 teodor@sigaev.ru          300                 :             12 :             weight = 1;
                                301                 :             12 :             break;
 2866 rhaas@postgresql.org      302                 :UBC           0 :         case 'D':
                                303                 :                :         case 'd':
 2956 teodor@sigaev.ru          304                 :              0 :             weight = 0;
                                305                 :              0 :             break;
                                306                 :              0 :         default:
                                307                 :                :             /* internal error */
                                308         [ #  # ]:              0 :             elog(ERROR, "unrecognized weight: %c", char_weight);
                                309                 :                :     }
                                310                 :                : 
 2956 teodor@sigaev.ru          311                 :CBC          12 :     tsout = (TSVector) palloc(VARSIZE(tsin));
                                312                 :             12 :     memcpy(tsout, tsin, VARSIZE(tsin));
                                313                 :             12 :     entry = ARRPTR(tsout);
                                314                 :                : 
  653 peter@eisentraut.org      315                 :             12 :     deconstruct_array_builtin(lexemes, TEXTOID, &dlexemes, &nulls, &nlexemes);
                                316                 :                : 
                                317                 :                :     /*
                                318                 :                :      * Assuming that lexemes array is significantly shorter than tsvector we
                                319                 :                :      * can iterate through lexemes performing binary search of each lexeme
                                320                 :                :      * from lexemes in tsvector.
                                321                 :                :      */
 2956 teodor@sigaev.ru          322         [ +  + ]:             36 :     for (i = 0; i < nlexemes; i++)
                                323                 :                :     {
                                324                 :                :         char       *lex;
                                325                 :                :         int         lex_len,
                                326                 :                :                     lex_pos;
                                327                 :                : 
                                328                 :                :         /* Ignore null array elements, they surely don't match */
                                329         [ +  + ]:             24 :         if (nulls[i])
  890 tgl@sss.pgh.pa.us         330                 :              3 :             continue;
                                331                 :                : 
 2956 teodor@sigaev.ru          332                 :             21 :         lex = VARDATA(dlexemes[i]);
 2590 noah@leadboat.com         333                 :             21 :         lex_len = VARSIZE(dlexemes[i]) - VARHDRSZ;
 2956 teodor@sigaev.ru          334                 :             21 :         lex_pos = tsvector_bsearch(tsout, lex, lex_len);
                                335                 :                : 
                                336   [ +  +  +  +  :             21 :         if (lex_pos >= 0 && (j = POSDATALEN(tsout, entry + lex_pos)) != 0)
                                              +  + ]
                                337                 :                :         {
                                338                 :             12 :             WordEntryPos *p = POSDATAPTR(tsout, entry + lex_pos);
                                339                 :                : 
                                340         [ +  + ]:             39 :             while (j--)
                                341                 :                :             {
                                342                 :             27 :                 WEP_SETWEIGHT(*p, weight);
                                343                 :             27 :                 p++;
                                344                 :                :             }
                                345                 :                :         }
                                346                 :                :     }
                                347                 :                : 
                                348         [ -  + ]:             12 :     PG_FREE_IF_COPY(tsin, 0);
                                349         [ -  + ]:             12 :     PG_FREE_IF_COPY(lexemes, 2);
                                350                 :                : 
                                351                 :             12 :     PG_RETURN_POINTER(tsout);
                                352                 :                : }
                                353                 :                : 
                                354                 :                : #define compareEntry(pa, a, pb, b) \
                                355                 :                :     tsCompareString((pa) + (a)->pos, (a)->len,    \
                                356                 :                :                     (pb) + (b)->pos, (b)->len,    \
                                357                 :                :                     false)
                                358                 :                : 
                                359                 :                : /*
                                360                 :                :  * Add positions from src to dest after offsetting them by maxpos.
                                361                 :                :  * Return the number added (might be less than expected due to overflow)
                                362                 :                :  */
                                363                 :                : static int32
 5995 bruce@momjian.us          364                 :              6 : add_pos(TSVector src, WordEntry *srcptr,
                                365                 :                :         TSVector dest, WordEntry *destptr,
                                366                 :                :         int32 maxpos)
                                367                 :                : {
 6060 teodor@sigaev.ru          368                 :              6 :     uint16     *clen = &_POSVECPTR(dest, destptr)->npos;
                                369                 :                :     int         i;
 6081 tgl@sss.pgh.pa.us         370         [ +  - ]:              6 :     uint16      slen = POSDATALEN(src, srcptr),
                                371                 :                :                 startlen;
                                372                 :              6 :     WordEntryPos *spos = POSDATAPTR(src, srcptr),
                                373                 :              6 :                *dpos = POSDATAPTR(dest, destptr);
                                374                 :                : 
                                375         [ -  + ]:              6 :     if (!destptr->haspos)
 6081 tgl@sss.pgh.pa.us         376                 :UBC           0 :         *clen = 0;
                                377                 :                : 
 6081 tgl@sss.pgh.pa.us         378                 :CBC           6 :     startlen = *clen;
 6018                           379                 :              6 :     for (i = 0;
                                380   [ +  +  +  - ]:             12 :          i < slen && *clen < MAXNUMPOS &&
 5995 bruce@momjian.us          381   [ +  +  +  - ]:              6 :          (*clen == 0 || WEP_GETPOS(dpos[*clen - 1]) != MAXENTRYPOS - 1);
 6018 tgl@sss.pgh.pa.us         382                 :              6 :          i++)
                                383                 :                :     {
 6081                           384                 :              6 :         WEP_SETWEIGHT(dpos[*clen], WEP_GETWEIGHT(spos[i]));
                                385                 :              6 :         WEP_SETPOS(dpos[*clen], LIMITPOS(WEP_GETPOS(spos[i]) + maxpos));
                                386                 :              6 :         (*clen)++;
                                387                 :                :     }
                                388                 :                : 
                                389         [ +  - ]:              6 :     if (*clen != startlen)
                                390                 :              6 :         destptr->haspos = 1;
                                391                 :              6 :     return *clen - startlen;
                                392                 :                : }
                                393                 :                : 
                                394                 :                : /*
                                395                 :                :  * Perform binary search of given lexeme in TSVector.
                                396                 :                :  * Returns lexeme position in TSVector's entry array or -1 if lexeme wasn't
                                397                 :                :  * found.
                                398                 :                :  */
                                399                 :                : static int
 2956 teodor@sigaev.ru          400                 :             99 : tsvector_bsearch(const TSVector tsv, char *lexeme, int lexeme_len)
                                401                 :                : {
                                402                 :             99 :     WordEntry  *arrin = ARRPTR(tsv);
                                403                 :             99 :     int         StopLow = 0,
                                404                 :             99 :                 StopHigh = tsv->size,
                                405                 :                :                 StopMiddle,
                                406                 :                :                 cmp;
                                407                 :                : 
                                408         [ +  + ]:            261 :     while (StopLow < StopHigh)
                                409                 :                :     {
 2866 rhaas@postgresql.org      410                 :            231 :         StopMiddle = (StopLow + StopHigh) / 2;
                                411                 :                : 
 2956 teodor@sigaev.ru          412                 :            231 :         cmp = tsCompareString(lexeme, lexeme_len,
 2866 rhaas@postgresql.org      413                 :            231 :                               STRPTR(tsv) + arrin[StopMiddle].pos,
                                414                 :            231 :                               arrin[StopMiddle].len,
                                415                 :                :                               false);
                                416                 :                : 
 2956 teodor@sigaev.ru          417         [ +  + ]:            231 :         if (cmp < 0)
                                418                 :            108 :             StopHigh = StopMiddle;
                                419         [ +  + ]:            123 :         else if (cmp > 0)
                                420                 :             54 :             StopLow = StopMiddle + 1;
                                421                 :                :         else                    /* found it */
                                422                 :             69 :             return StopMiddle;
                                423                 :                :     }
                                424                 :                : 
                                425                 :             30 :     return -1;
                                426                 :                : }
                                427                 :                : 
                                428                 :                : /*
                                429                 :                :  * qsort comparator functions
                                430                 :                :  */
                                431                 :                : 
                                432                 :                : static int
 2809 tgl@sss.pgh.pa.us         433                 :             39 : compare_int(const void *va, const void *vb)
                                434                 :                : {
                                435                 :             39 :     int         a = *((const int *) va);
                                436                 :             39 :     int         b = *((const int *) vb);
                                437                 :                : 
   58 nathan@postgresql.or      438                 :GNC          39 :     return pg_cmp_s32(a, b);
                                439                 :                : }
                                440                 :                : 
                                441                 :                : static int
 2809 tgl@sss.pgh.pa.us         442                 :CBC          51 : compare_text_lexemes(const void *va, const void *vb)
                                443                 :                : {
                                444                 :             51 :     Datum       a = *((const Datum *) va);
                                445                 :             51 :     Datum       b = *((const Datum *) vb);
                                446         [ -  + ]:             51 :     char       *alex = VARDATA_ANY(a);
                                447   [ -  +  -  -  :             51 :     int         alex_len = VARSIZE_ANY_EXHDR(a);
                                     -  -  -  -  -  
                                                 + ]
                                448         [ -  + ]:             51 :     char       *blex = VARDATA_ANY(b);
                                449   [ -  +  -  -  :             51 :     int         blex_len = VARSIZE_ANY_EXHDR(b);
                                     -  -  -  -  -  
                                                 + ]
                                450                 :                : 
                                451                 :             51 :     return tsCompareString(alex, alex_len, blex, blex_len, false);
                                452                 :                : }
                                453                 :                : 
                                454                 :                : /*
                                455                 :                :  * Internal routine to delete lexemes from TSVector by array of offsets.
                                456                 :                :  *
                                457                 :                :  * int *indices_to_delete -- array of lexeme offsets to delete (modified here!)
                                458                 :                :  * int indices_count -- size of that array
                                459                 :                :  *
                                460                 :                :  * Returns new TSVector without given lexemes along with their positions
                                461                 :                :  * and weights.
                                462                 :                :  */
                                463                 :                : static TSVector
 2956 teodor@sigaev.ru          464                 :             33 : tsvector_delete_by_indices(TSVector tsv, int *indices_to_delete,
                                465                 :                :                            int indices_count)
                                466                 :                : {
                                467                 :                :     TSVector    tsout;
                                468                 :             33 :     WordEntry  *arrin = ARRPTR(tsv),
                                469                 :                :                *arrout;
                                470                 :             33 :     char       *data = STRPTR(tsv),
                                471                 :                :                *dataout;
                                472                 :                :     int         i,              /* index in arrin */
                                473                 :                :                 j,              /* index in arrout */
                                474                 :                :                 k,              /* index in indices_to_delete */
                                475                 :                :                 curoff;         /* index in dataout area */
                                476                 :                : 
                                477                 :                :     /*
                                478                 :                :      * Sort the filter array to simplify membership checks below.  Also, get
                                479                 :                :      * rid of any duplicate entries, so that we can assume that indices_count
                                480                 :                :      * is exactly equal to the number of lexemes that will be removed.
                                481                 :                :      */
                                482         [ +  + ]:             33 :     if (indices_count > 1)
                                483                 :                :     {
 2809 tgl@sss.pgh.pa.us         484                 :             15 :         qsort(indices_to_delete, indices_count, sizeof(int), compare_int);
 1620 tmunro@postgresql.or      485                 :             15 :         indices_count = qunique(indices_to_delete, indices_count, sizeof(int),
                                486                 :                :                                 compare_int);
                                487                 :                :     }
                                488                 :                : 
                                489                 :                :     /*
                                490                 :                :      * Here we overestimate tsout size, since we don't know how much space is
                                491                 :                :      * used by the deleted lexeme(s).  We will set exact size below.
                                492                 :                :      */
 2809 tgl@sss.pgh.pa.us         493                 :             33 :     tsout = (TSVector) palloc0(VARSIZE(tsv));
                                494                 :                : 
                                495                 :                :     /* This count must be correct because STRPTR(tsout) relies on it. */
                                496                 :             33 :     tsout->size = tsv->size - indices_count;
                                497                 :                : 
                                498                 :                :     /*
                                499                 :                :      * Copy tsv to tsout, skipping lexemes listed in indices_to_delete.
                                500                 :                :      */
                                501                 :             33 :     arrout = ARRPTR(tsout);
 2956 teodor@sigaev.ru          502                 :             33 :     dataout = STRPTR(tsout);
 2809 tgl@sss.pgh.pa.us         503                 :             33 :     curoff = 0;
 2956 teodor@sigaev.ru          504         [ +  + ]:            198 :     for (i = j = k = 0; i < tsv->size; i++)
                                505                 :                :     {
                                506                 :                :         /*
                                507                 :                :          * If current i is present in indices_to_delete, skip this lexeme.
                                508                 :                :          * Since indices_to_delete is already sorted, we only need to check
                                509                 :                :          * the current (k'th) entry.
                                510                 :                :          */
 2866 rhaas@postgresql.org      511   [ +  +  +  + ]:            165 :         if (k < indices_count && i == indices_to_delete[k])
                                512                 :                :         {
 2956 teodor@sigaev.ru          513                 :             48 :             k++;
                                514                 :             48 :             continue;
                                515                 :                :         }
                                516                 :                : 
                                517                 :                :         /* Copy lexeme and its positions and weights */
                                518                 :            117 :         memcpy(dataout + curoff, data + arrin[i].pos, arrin[i].len);
                                519                 :            117 :         arrout[j].haspos = arrin[i].haspos;
                                520                 :            117 :         arrout[j].len = arrin[i].len;
                                521                 :            117 :         arrout[j].pos = curoff;
                                522                 :            117 :         curoff += arrin[i].len;
                                523         [ +  + ]:            117 :         if (arrin[i].haspos)
                                524                 :                :         {
 2809 tgl@sss.pgh.pa.us         525         [ +  - ]:             78 :             int         len = POSDATALEN(tsv, arrin + i) * sizeof(WordEntryPos)
  331                           526                 :             78 :                 + sizeof(uint16);
                                527                 :                : 
 2956 teodor@sigaev.ru          528                 :             78 :             curoff = SHORTALIGN(curoff);
                                529                 :             78 :             memcpy(dataout + curoff,
                                530                 :             78 :                    STRPTR(tsv) + SHORTALIGN(arrin[i].pos + arrin[i].len),
                                531                 :                :                    len);
                                532                 :             78 :             curoff += len;
                                533                 :                :         }
                                534                 :                : 
                                535                 :            117 :         j++;
                                536                 :                :     }
                                537                 :                : 
                                538                 :                :     /*
                                539                 :                :      * k should now be exactly equal to indices_count. If it isn't then the
                                540                 :                :      * caller provided us with indices outside of [0, tsv->size) range and
                                541                 :                :      * estimation of tsout's size is wrong.
                                542                 :                :      */
                                543         [ -  + ]:             33 :     Assert(k == indices_count);
                                544                 :                : 
                                545                 :             33 :     SET_VARSIZE(tsout, CALCDATASIZE(tsout->size, curoff));
                                546                 :             33 :     return tsout;
                                547                 :                : }
                                548                 :                : 
                                549                 :                : /*
                                550                 :                :  * Delete given lexeme from tsvector.
                                551                 :                :  * Implementation of user-level ts_delete(tsvector, text).
                                552                 :                :  */
                                553                 :                : Datum
                                554                 :             18 : tsvector_delete_str(PG_FUNCTION_ARGS)
                                555                 :                : {
                                556                 :             18 :     TSVector    tsin = PG_GETARG_TSVECTOR(0),
                                557                 :                :                 tsout;
 2590 noah@leadboat.com         558                 :             18 :     text       *tlexeme = PG_GETARG_TEXT_PP(1);
                                559         [ -  + ]:             18 :     char       *lexeme = VARDATA_ANY(tlexeme);
 2956 teodor@sigaev.ru          560   [ -  +  -  -  :             18 :     int         lexeme_len = VARSIZE_ANY_EXHDR(tlexeme),
                                     -  -  -  -  -  
                                                 + ]
                                561                 :                :                 skip_index;
                                562                 :                : 
                                563         [ +  + ]:             18 :     if ((skip_index = tsvector_bsearch(tsin, lexeme, lexeme_len)) == -1)
                                564                 :              6 :         PG_RETURN_POINTER(tsin);
                                565                 :                : 
                                566                 :             12 :     tsout = tsvector_delete_by_indices(tsin, &skip_index, 1);
                                567                 :                : 
                                568         [ -  + ]:             12 :     PG_FREE_IF_COPY(tsin, 0);
                                569         [ -  + ]:             12 :     PG_FREE_IF_COPY(tlexeme, 1);
                                570                 :             12 :     PG_RETURN_POINTER(tsout);
                                571                 :                : }
                                572                 :                : 
                                573                 :                : /*
                                574                 :                :  * Delete given array of lexemes from tsvector.
                                575                 :                :  * Implementation of user-level ts_delete(tsvector, text[]).
                                576                 :                :  */
                                577                 :                : Datum
                                578                 :             21 : tsvector_delete_arr(PG_FUNCTION_ARGS)
                                579                 :                : {
                                580                 :             21 :     TSVector    tsin = PG_GETARG_TSVECTOR(0),
                                581                 :                :                 tsout;
                                582                 :             21 :     ArrayType  *lexemes = PG_GETARG_ARRAYTYPE_P(1);
                                583                 :                :     int         i,
                                584                 :                :                 nlex,
                                585                 :                :                 skip_count,
                                586                 :                :                *skip_indices;
                                587                 :                :     Datum      *dlexemes;
                                588                 :                :     bool       *nulls;
                                589                 :                : 
  653 peter@eisentraut.org      590                 :             21 :     deconstruct_array_builtin(lexemes, TEXTOID, &dlexemes, &nulls, &nlex);
                                591                 :                : 
                                592                 :                :     /*
                                593                 :                :      * In typical use case array of lexemes to delete is relatively small. So
                                594                 :                :      * here we optimize things for that scenario: iterate through lexarr
                                595                 :                :      * performing binary search of each lexeme from lexarr in tsvector.
                                596                 :                :      */
 2956 teodor@sigaev.ru          597                 :             21 :     skip_indices = palloc0(nlex * sizeof(int));
                                598         [ +  + ]:             84 :     for (i = skip_count = 0; i < nlex; i++)
                                599                 :                :     {
                                600                 :                :         char       *lex;
                                601                 :                :         int         lex_len,
                                602                 :                :                     lex_pos;
                                603                 :                : 
                                604                 :                :         /* Ignore null array elements, they surely don't match */
                                605         [ +  + ]:             63 :         if (nulls[i])
  890 tgl@sss.pgh.pa.us         606                 :              3 :             continue;
                                607                 :                : 
 2590 noah@leadboat.com         608                 :             60 :         lex = VARDATA(dlexemes[i]);
                                609                 :             60 :         lex_len = VARSIZE(dlexemes[i]) - VARHDRSZ;
 2956 teodor@sigaev.ru          610                 :             60 :         lex_pos = tsvector_bsearch(tsin, lex, lex_len);
                                611                 :                : 
                                612         [ +  + ]:             60 :         if (lex_pos >= 0)
                                613                 :             39 :             skip_indices[skip_count++] = lex_pos;
                                614                 :                :     }
                                615                 :                : 
                                616                 :             21 :     tsout = tsvector_delete_by_indices(tsin, skip_indices, skip_count);
                                617                 :                : 
                                618                 :             21 :     pfree(skip_indices);
                                619         [ -  + ]:             21 :     PG_FREE_IF_COPY(tsin, 0);
                                620         [ -  + ]:             21 :     PG_FREE_IF_COPY(lexemes, 1);
                                621                 :                : 
                                622                 :             21 :     PG_RETURN_POINTER(tsout);
                                623                 :                : }
                                624                 :                : 
                                625                 :                : /*
                                626                 :                :  * Expand tsvector as table with following columns:
                                627                 :                :  *     lexeme: lexeme text
                                628                 :                :  *     positions: integer array of lexeme positions
                                629                 :                :  *     weights: char array of weights corresponding to positions
                                630                 :                :  */
                                631                 :                : Datum
                                632                 :             90 : tsvector_unnest(PG_FUNCTION_ARGS)
                                633                 :                : {
                                634                 :                :     FuncCallContext *funcctx;
                                635                 :                :     TSVector    tsin;
                                636                 :                : 
                                637         [ +  + ]:             90 :     if (SRF_IS_FIRSTCALL())
                                638                 :                :     {
                                639                 :                :         MemoryContext oldcontext;
                                640                 :                :         TupleDesc   tupdesc;
                                641                 :                : 
                                642                 :             15 :         funcctx = SRF_FIRSTCALL_INIT();
                                643                 :             15 :         oldcontext = MemoryContextSwitchTo(funcctx->multi_call_memory_ctx);
                                644                 :                : 
 1972 andres@anarazel.de        645                 :             15 :         tupdesc = CreateTemplateTupleDesc(3);
 2956 teodor@sigaev.ru          646                 :             15 :         TupleDescInitEntry(tupdesc, (AttrNumber) 1, "lexeme",
                                647                 :                :                            TEXTOID, -1, 0);
                                648                 :             15 :         TupleDescInitEntry(tupdesc, (AttrNumber) 2, "positions",
                                649                 :                :                            INT2ARRAYOID, -1, 0);
                                650                 :             15 :         TupleDescInitEntry(tupdesc, (AttrNumber) 3, "weights",
                                651                 :                :                            TEXTARRAYOID, -1, 0);
  480 michael@paquier.xyz       652         [ -  + ]:             15 :         if (get_call_result_type(fcinfo, NULL, &tupdesc) != TYPEFUNC_COMPOSITE)
  480 michael@paquier.xyz       653         [ #  # ]:UBC           0 :             elog(ERROR, "return type must be a row type");
  480 michael@paquier.xyz       654                 :CBC          15 :         funcctx->tuple_desc = tupdesc;
                                655                 :                : 
 2956 teodor@sigaev.ru          656                 :             15 :         funcctx->user_fctx = PG_GETARG_TSVECTOR_COPY(0);
                                657                 :                : 
                                658                 :             15 :         MemoryContextSwitchTo(oldcontext);
                                659                 :                :     }
                                660                 :                : 
                                661                 :             90 :     funcctx = SRF_PERCALL_SETUP();
                                662                 :             90 :     tsin = (TSVector) funcctx->user_fctx;
                                663                 :                : 
                                664         [ +  + ]:             90 :     if (funcctx->call_cntr < tsin->size)
                                665                 :                :     {
                                666                 :             75 :         WordEntry  *arrin = ARRPTR(tsin);
                                667                 :             75 :         char       *data = STRPTR(tsin);
                                668                 :                :         HeapTuple   tuple;
                                669                 :                :         int         j,
                                670                 :             75 :                     i = funcctx->call_cntr;
                                671                 :             75 :         bool        nulls[] = {false, false, false};
                                672                 :                :         Datum       values[3];
                                673                 :                : 
 1536 alvherre@alvh.no-ip.      674                 :             75 :         values[0] = PointerGetDatum(cstring_to_text_with_len(data + arrin[i].pos, arrin[i].len));
                                675                 :                : 
 2956 teodor@sigaev.ru          676         [ +  + ]:             75 :         if (arrin[i].haspos)
                                677                 :                :         {
                                678                 :                :             WordEntryPosVector *posv;
                                679                 :                :             Datum      *positions;
                                680                 :                :             Datum      *weights;
                                681                 :                :             char        weight;
                                682                 :                : 
                                683                 :                :             /*
                                684                 :                :              * Internally tsvector stores position and weight in the same
                                685                 :                :              * uint16 (2 bits for weight, 14 for position). Here we extract
                                686                 :                :              * that in two separate arrays.
                                687                 :                :              */
                                688                 :             45 :             posv = _POSVECPTR(tsin, arrin + i);
                                689                 :             45 :             positions = palloc(posv->npos * sizeof(Datum));
 2866 rhaas@postgresql.org      690                 :             45 :             weights = palloc(posv->npos * sizeof(Datum));
 2956 teodor@sigaev.ru          691         [ +  + ]:            126 :             for (j = 0; j < posv->npos; j++)
                                692                 :                :             {
                                693                 :             81 :                 positions[j] = Int16GetDatum(WEP_GETPOS(posv->pos[j]));
                                694                 :             81 :                 weight = 'D' - WEP_GETWEIGHT(posv->pos[j]);
 1536 alvherre@alvh.no-ip.      695                 :             81 :                 weights[j] = PointerGetDatum(cstring_to_text_with_len(&weight,
                                696                 :                :                                                                       1));
                                697                 :                :             }
                                698                 :                : 
  653 peter@eisentraut.org      699                 :             45 :             values[1] = PointerGetDatum(construct_array_builtin(positions, posv->npos, INT2OID));
                                700                 :             45 :             values[2] = PointerGetDatum(construct_array_builtin(weights, posv->npos, TEXTOID));
                                701                 :                :         }
                                702                 :                :         else
                                703                 :                :         {
 2956 teodor@sigaev.ru          704                 :             30 :             nulls[1] = nulls[2] = true;
                                705                 :                :         }
                                706                 :                : 
                                707                 :             75 :         tuple = heap_form_tuple(funcctx->tuple_desc, values, nulls);
                                708                 :             75 :         SRF_RETURN_NEXT(funcctx, HeapTupleGetDatum(tuple));
                                709                 :                :     }
                                710                 :                :     else
                                711                 :                :     {
                                712                 :             15 :         SRF_RETURN_DONE(funcctx);
                                713                 :                :     }
                                714                 :                : }
                                715                 :                : 
                                716                 :                : /*
                                717                 :                :  * Convert tsvector to array of lexemes.
                                718                 :                :  */
                                719                 :                : Datum
                                720                 :              6 : tsvector_to_array(PG_FUNCTION_ARGS)
                                721                 :                : {
 2866 rhaas@postgresql.org      722                 :              6 :     TSVector    tsin = PG_GETARG_TSVECTOR(0);
                                723                 :              6 :     WordEntry  *arrin = ARRPTR(tsin);
                                724                 :                :     Datum      *elements;
                                725                 :                :     int         i;
                                726                 :                :     ArrayType  *array;
                                727                 :                : 
 2956 teodor@sigaev.ru          728                 :              6 :     elements = palloc(tsin->size * sizeof(Datum));
                                729                 :                : 
                                730         [ +  + ]:             36 :     for (i = 0; i < tsin->size; i++)
                                731                 :                :     {
 1536 alvherre@alvh.no-ip.      732                 :             30 :         elements[i] = PointerGetDatum(cstring_to_text_with_len(STRPTR(tsin) + arrin[i].pos,
                                733                 :             30 :                                                                arrin[i].len));
                                734                 :                :     }
                                735                 :                : 
  653 peter@eisentraut.org      736                 :              6 :     array = construct_array_builtin(elements, tsin->size, TEXTOID);
                                737                 :                : 
 2956 teodor@sigaev.ru          738                 :              6 :     pfree(elements);
                                739         [ -  + ]:              6 :     PG_FREE_IF_COPY(tsin, 0);
                                740                 :              6 :     PG_RETURN_POINTER(array);
                                741                 :                : }
                                742                 :                : 
                                743                 :                : /*
                                744                 :                :  * Build tsvector from array of lexemes.
                                745                 :                :  */
                                746                 :                : Datum
                                747                 :             12 : array_to_tsvector(PG_FUNCTION_ARGS)
                                748                 :                : {
                                749                 :             12 :     ArrayType  *v = PG_GETARG_ARRAYTYPE_P(0);
                                750                 :                :     TSVector    tsout;
                                751                 :                :     Datum      *dlexemes;
                                752                 :                :     WordEntry  *arrout;
                                753                 :                :     bool       *nulls;
                                754                 :                :     int         nitems,
                                755                 :                :                 i,
                                756                 :                :                 tslen,
                                757                 :             12 :                 datalen = 0;
                                758                 :                :     char       *cur;
                                759                 :                : 
  653 peter@eisentraut.org      760                 :             12 :     deconstruct_array_builtin(v, TEXTOID, &dlexemes, &nulls, &nitems);
                                761                 :                : 
                                762                 :                :     /*
                                763                 :                :      * Reject nulls and zero length strings (maybe we should just ignore them,
                                764                 :                :      * instead?)
                                765                 :                :      */
 2956 teodor@sigaev.ru          766         [ +  + ]:             63 :     for (i = 0; i < nitems; i++)
                                767                 :                :     {
                                768         [ +  + ]:             57 :         if (nulls[i])
                                769         [ +  - ]:              3 :             ereport(ERROR,
                                770                 :                :                     (errcode(ERRCODE_NULL_VALUE_NOT_ALLOWED),
                                771                 :                :                      errmsg("lexeme array may not contain nulls")));
                                772                 :                : 
  890 tgl@sss.pgh.pa.us         773         [ +  + ]:             54 :         if (VARSIZE(dlexemes[i]) - VARHDRSZ == 0)
                                774         [ +  - ]:              3 :             ereport(ERROR,
                                775                 :                :                     (errcode(ERRCODE_ZERO_LENGTH_CHARACTER_STRING),
                                776                 :                :                      errmsg("lexeme array may not contain empty strings")));
                                777                 :                :     }
                                778                 :                : 
                                779                 :                :     /* Sort and de-dup, because this is required for a valid tsvector. */
 2809                           780         [ +  - ]:              6 :     if (nitems > 1)
                                781                 :                :     {
                                782                 :              6 :         qsort(dlexemes, nitems, sizeof(Datum), compare_text_lexemes);
 1620 tmunro@postgresql.or      783                 :              6 :         nitems = qunique(dlexemes, nitems, sizeof(Datum),
                                784                 :                :                          compare_text_lexemes);
                                785                 :                :     }
                                786                 :                : 
                                787                 :                :     /* Calculate space needed for surviving lexemes. */
 2809 tgl@sss.pgh.pa.us         788         [ +  + ]:             30 :     for (i = 0; i < nitems; i++)
 2590 noah@leadboat.com         789                 :             24 :         datalen += VARSIZE(dlexemes[i]) - VARHDRSZ;
 2956 teodor@sigaev.ru          790                 :              6 :     tslen = CALCDATASIZE(nitems, datalen);
                                791                 :                : 
                                792                 :                :     /* Allocate and fill tsvector. */
                                793                 :              6 :     tsout = (TSVector) palloc0(tslen);
                                794                 :              6 :     SET_VARSIZE(tsout, tslen);
                                795                 :              6 :     tsout->size = nitems;
                                796                 :                : 
                                797                 :              6 :     arrout = ARRPTR(tsout);
                                798                 :              6 :     cur = STRPTR(tsout);
                                799         [ +  + ]:             30 :     for (i = 0; i < nitems; i++)
                                800                 :                :     {
 2590 noah@leadboat.com         801                 :             24 :         char       *lex = VARDATA(dlexemes[i]);
                                802                 :             24 :         int         lex_len = VARSIZE(dlexemes[i]) - VARHDRSZ;
                                803                 :                : 
 2956 teodor@sigaev.ru          804                 :             24 :         memcpy(cur, lex, lex_len);
                                805                 :             24 :         arrout[i].haspos = 0;
                                806                 :             24 :         arrout[i].len = lex_len;
                                807                 :             24 :         arrout[i].pos = cur - STRPTR(tsout);
                                808                 :             24 :         cur += lex_len;
                                809                 :                :     }
                                810                 :                : 
                                811         [ -  + ]:              6 :     PG_FREE_IF_COPY(v, 0);
                                812                 :              6 :     PG_RETURN_POINTER(tsout);
                                813                 :                : }
                                814                 :                : 
                                815                 :                : /*
                                816                 :                :  * ts_filter(): keep only lexemes with given weights in tsvector.
                                817                 :                :  */
                                818                 :                : Datum
                                819                 :              9 : tsvector_filter(PG_FUNCTION_ARGS)
                                820                 :                : {
                                821                 :              9 :     TSVector    tsin = PG_GETARG_TSVECTOR(0),
                                822                 :                :                 tsout;
                                823                 :              9 :     ArrayType  *weights = PG_GETARG_ARRAYTYPE_P(1);
                                824                 :              9 :     WordEntry  *arrin = ARRPTR(tsin),
                                825                 :                :                *arrout;
                                826                 :              9 :     char       *datain = STRPTR(tsin),
                                827                 :                :                *dataout;
                                828                 :                :     Datum      *dweights;
                                829                 :                :     bool       *nulls;
                                830                 :                :     int         nweights;
                                831                 :                :     int         i,
                                832                 :                :                 j;
 2902                           833                 :              9 :     int         cur_pos = 0;
                                834                 :              9 :     char        mask = 0;
                                835                 :                : 
  653 peter@eisentraut.org      836                 :              9 :     deconstruct_array_builtin(weights, CHAROID, &dweights, &nulls, &nweights);
                                837                 :                : 
 2901 tgl@sss.pgh.pa.us         838         [ +  + ]:             21 :     for (i = 0; i < nweights; i++)
                                839                 :                :     {
                                840                 :                :         char        char_weight;
                                841                 :                : 
 2956 teodor@sigaev.ru          842         [ +  + ]:             15 :         if (nulls[i])
                                843         [ +  - ]:              3 :             ereport(ERROR,
                                844                 :                :                     (errcode(ERRCODE_NULL_VALUE_NOT_ALLOWED),
                                845                 :                :                      errmsg("weight array may not contain nulls")));
                                846                 :                : 
                                847                 :             12 :         char_weight = DatumGetChar(dweights[i]);
                                848   [ +  +  -  -  :             12 :         switch (char_weight)
                                                 - ]
                                849                 :                :         {
 2866 rhaas@postgresql.org      850                 :              9 :             case 'A':
                                851                 :                :             case 'a':
 2956 teodor@sigaev.ru          852                 :              9 :                 mask = mask | 8;
                                853                 :              9 :                 break;
 2866 rhaas@postgresql.org      854                 :              3 :             case 'B':
                                855                 :                :             case 'b':
 2956 teodor@sigaev.ru          856                 :              3 :                 mask = mask | 4;
                                857                 :              3 :                 break;
 2866 rhaas@postgresql.org      858                 :UBC           0 :             case 'C':
                                859                 :                :             case 'c':
 2956 teodor@sigaev.ru          860                 :              0 :                 mask = mask | 2;
                                861                 :              0 :                 break;
 2866 rhaas@postgresql.org      862                 :              0 :             case 'D':
                                863                 :                :             case 'd':
 2956 teodor@sigaev.ru          864                 :              0 :                 mask = mask | 1;
                                865                 :              0 :                 break;
                                866                 :              0 :             default:
 2866 rhaas@postgresql.org      867         [ #  # ]:              0 :                 ereport(ERROR,
                                868                 :                :                         (errcode(ERRCODE_INVALID_PARAMETER_VALUE),
                                869                 :                :                          errmsg("unrecognized weight: \"%c\"", char_weight)));
                                870                 :                :         }
                                871                 :                :     }
                                872                 :                : 
 2956 teodor@sigaev.ru          873                 :CBC           6 :     tsout = (TSVector) palloc0(VARSIZE(tsin));
                                874                 :              6 :     tsout->size = tsin->size;
                                875                 :              6 :     arrout = ARRPTR(tsout);
                                876                 :              6 :     dataout = STRPTR(tsout);
                                877                 :                : 
                                878         [ +  + ]:             54 :     for (i = j = 0; i < tsin->size; i++)
                                879                 :                :     {
                                880                 :                :         WordEntryPosVector *posvin,
                                881                 :                :                    *posvout;
 2866 rhaas@postgresql.org      882                 :             48 :         int         npos = 0;
                                883                 :                :         int         k;
                                884                 :                : 
 2956 teodor@sigaev.ru          885         [ +  + ]:             48 :         if (!arrin[i].haspos)
                                886                 :             15 :             continue;
                                887                 :                : 
 2866 rhaas@postgresql.org      888                 :             33 :         posvin = _POSVECPTR(tsin, arrin + i);
 2956 teodor@sigaev.ru          889                 :             33 :         posvout = (WordEntryPosVector *)
 2866 rhaas@postgresql.org      890                 :             33 :             (dataout + SHORTALIGN(cur_pos + arrin[i].len));
                                891                 :                : 
 2956 teodor@sigaev.ru          892         [ +  + ]:             66 :         for (k = 0; k < posvin->npos; k++)
                                893                 :                :         {
                                894         [ +  + ]:             33 :             if (mask & (1 << WEP_GETWEIGHT(posvin->pos[k])))
                                895                 :             15 :                 posvout->pos[npos++] = posvin->pos[k];
                                896                 :                :         }
                                897                 :                : 
                                898                 :                :         /* if no satisfactory positions found, skip lexeme */
 2903 rhaas@postgresql.org      899         [ +  + ]:             33 :         if (!npos)
 2956 teodor@sigaev.ru          900                 :             18 :             continue;
                                901                 :                : 
                                902                 :             15 :         arrout[j].haspos = true;
                                903                 :             15 :         arrout[j].len = arrin[i].len;
                                904                 :             15 :         arrout[j].pos = cur_pos;
                                905                 :                : 
                                906                 :             15 :         memcpy(dataout + cur_pos, datain + arrin[i].pos, arrin[i].len);
                                907                 :             15 :         posvout->npos = npos;
                                908                 :             15 :         cur_pos += SHORTALIGN(arrin[i].len);
 2866 rhaas@postgresql.org      909         [ +  - ]:             15 :         cur_pos += POSDATALEN(tsout, arrout + j) * sizeof(WordEntryPos) +
                                910                 :                :             sizeof(uint16);
 2956 teodor@sigaev.ru          911                 :             15 :         j++;
                                912                 :                :     }
                                913                 :                : 
                                914                 :              6 :     tsout->size = j;
                                915         [ +  - ]:              6 :     if (dataout != STRPTR(tsout))
                                916                 :              6 :         memmove(STRPTR(tsout), dataout, cur_pos);
                                917                 :                : 
                                918                 :              6 :     SET_VARSIZE(tsout, CALCDATASIZE(tsout->size, cur_pos));
                                919                 :                : 
                                920         [ -  + ]:              6 :     PG_FREE_IF_COPY(tsin, 0);
                                921                 :              6 :     PG_RETURN_POINTER(tsout);
                                922                 :                : }
                                923                 :                : 
                                924                 :                : Datum
 6081 tgl@sss.pgh.pa.us         925                 :              6 : tsvector_concat(PG_FUNCTION_ARGS)
                                926                 :                : {
                                927                 :              6 :     TSVector    in1 = PG_GETARG_TSVECTOR(0);
                                928                 :              6 :     TSVector    in2 = PG_GETARG_TSVECTOR(1);
                                929                 :                :     TSVector    out;
                                930                 :                :     WordEntry  *ptr;
                                931                 :                :     WordEntry  *ptr1,
                                932                 :                :                *ptr2;
                                933                 :                :     WordEntryPos *p;
                                934                 :              6 :     int         maxpos = 0,
                                935                 :                :                 i,
                                936                 :                :                 j,
                                937                 :                :                 i1,
                                938                 :                :                 i2,
                                939                 :                :                 dataoff,
                                940                 :                :                 output_bytes,
                                941                 :                :                 output_size;
                                942                 :                :     char       *data,
                                943                 :                :                *data1,
                                944                 :                :                *data2;
                                945                 :                : 
                                946                 :                :     /* Get max position in in1; we'll need this to offset in2's positions */
                                947                 :              6 :     ptr = ARRPTR(in1);
                                948                 :              6 :     i = in1->size;
                                949         [ +  + ]:             15 :     while (i--)
                                950                 :                :     {
                                951   [ +  -  +  - ]:              9 :         if ((j = POSDATALEN(in1, ptr)) != 0)
                                952                 :                :         {
                                953                 :              9 :             p = POSDATAPTR(in1, ptr);
                                954         [ +  + ]:             18 :             while (j--)
                                955                 :                :             {
                                956         [ +  + ]:              9 :                 if (WEP_GETPOS(*p) > maxpos)
                                957                 :              6 :                     maxpos = WEP_GETPOS(*p);
                                958                 :              9 :                 p++;
                                959                 :                :             }
                                960                 :                :         }
                                961                 :              9 :         ptr++;
                                962                 :                :     }
                                963                 :                : 
                                964                 :              6 :     ptr1 = ARRPTR(in1);
                                965                 :              6 :     ptr2 = ARRPTR(in2);
                                966                 :              6 :     data1 = STRPTR(in1);
                                967                 :              6 :     data2 = STRPTR(in2);
                                968                 :              6 :     i1 = in1->size;
                                969                 :              6 :     i2 = in2->size;
                                970                 :                : 
                                971                 :                :     /*
                                972                 :                :      * Conservative estimate of space needed.  We might need all the data in
                                973                 :                :      * both inputs, and conceivably add a pad byte before position data for
                                974                 :                :      * each item where there was none before.
                                975                 :                :      */
 4615                           976                 :              6 :     output_bytes = VARSIZE(in1) + VARSIZE(in2) + i1 + i2;
                                977                 :                : 
                                978                 :              6 :     out = (TSVector) palloc0(output_bytes);
                                979                 :              6 :     SET_VARSIZE(out, output_bytes);
                                980                 :                : 
                                981                 :                :     /*
                                982                 :                :      * We must make out->size valid so that STRPTR(out) is sensible.  We'll
                                983                 :                :      * collapse out any unused space at the end.
                                984                 :                :      */
 6081                           985                 :              6 :     out->size = in1->size + in2->size;
                                986                 :                : 
                                987                 :              6 :     ptr = ARRPTR(out);
 6018                           988                 :              6 :     data = STRPTR(out);
                                989                 :              6 :     dataoff = 0;
 6081                           990   [ +  +  +  + ]:             15 :     while (i1 && i2)
                                991                 :                :     {
                                992                 :              9 :         int         cmp = compareEntry(data1, ptr1, data2, ptr2);
                                993                 :                : 
                                994         [ +  + ]:              9 :         if (cmp < 0)
                                995                 :                :         {                       /* in1 first */
                                996                 :              3 :             ptr->haspos = ptr1->haspos;
                                997                 :              3 :             ptr->len = ptr1->len;
 6018                           998                 :              3 :             memcpy(data + dataoff, data1 + ptr1->pos, ptr1->len);
                                999                 :              3 :             ptr->pos = dataoff;
                               1000                 :              3 :             dataoff += ptr1->len;
 6081                          1001         [ +  - ]:              3 :             if (ptr->haspos)
                               1002                 :                :             {
 6018                          1003                 :              3 :                 dataoff = SHORTALIGN(dataoff);
                               1004         [ +  - ]:              3 :                 memcpy(data + dataoff, _POSVECPTR(in1, ptr1), POSDATALEN(in1, ptr1) * sizeof(WordEntryPos) + sizeof(uint16));
                               1005         [ +  - ]:              3 :                 dataoff += POSDATALEN(in1, ptr1) * sizeof(WordEntryPos) + sizeof(uint16);
                               1006                 :                :             }
                               1007                 :                : 
 6081                          1008                 :              3 :             ptr++;
                               1009                 :              3 :             ptr1++;
                               1010                 :              3 :             i1--;
                               1011                 :                :         }
                               1012         [ +  + ]:              6 :         else if (cmp > 0)
                               1013                 :                :         {                       /* in2 first */
                               1014                 :              3 :             ptr->haspos = ptr2->haspos;
                               1015                 :              3 :             ptr->len = ptr2->len;
 6018                          1016                 :              3 :             memcpy(data + dataoff, data2 + ptr2->pos, ptr2->len);
                               1017                 :              3 :             ptr->pos = dataoff;
                               1018                 :              3 :             dataoff += ptr2->len;
 6081                          1019         [ -  + ]:              3 :             if (ptr->haspos)
                               1020                 :                :             {
 6081 tgl@sss.pgh.pa.us        1021                 :UBC           0 :                 int         addlen = add_pos(in2, ptr2, out, ptr, maxpos);
                               1022                 :                : 
                               1023         [ #  # ]:              0 :                 if (addlen == 0)
                               1024                 :              0 :                     ptr->haspos = 0;
                               1025                 :                :                 else
                               1026                 :                :                 {
 6018                          1027                 :              0 :                     dataoff = SHORTALIGN(dataoff);
                               1028                 :              0 :                     dataoff += addlen * sizeof(WordEntryPos) + sizeof(uint16);
                               1029                 :                :                 }
                               1030                 :                :             }
                               1031                 :                : 
 6081 tgl@sss.pgh.pa.us        1032                 :CBC           3 :             ptr++;
                               1033                 :              3 :             ptr2++;
                               1034                 :              3 :             i2--;
                               1035                 :                :         }
                               1036                 :                :         else
                               1037                 :                :         {
                               1038                 :              3 :             ptr->haspos = ptr1->haspos | ptr2->haspos;
                               1039                 :              3 :             ptr->len = ptr1->len;
 6018                          1040                 :              3 :             memcpy(data + dataoff, data1 + ptr1->pos, ptr1->len);
                               1041                 :              3 :             ptr->pos = dataoff;
                               1042                 :              3 :             dataoff += ptr1->len;
 6081                          1043         [ +  - ]:              3 :             if (ptr->haspos)
                               1044                 :                :             {
                               1045         [ +  - ]:              3 :                 if (ptr1->haspos)
                               1046                 :                :                 {
 6018                          1047                 :              3 :                     dataoff = SHORTALIGN(dataoff);
                               1048         [ +  - ]:              3 :                     memcpy(data + dataoff, _POSVECPTR(in1, ptr1), POSDATALEN(in1, ptr1) * sizeof(WordEntryPos) + sizeof(uint16));
                               1049         [ +  - ]:              3 :                     dataoff += POSDATALEN(in1, ptr1) * sizeof(WordEntryPos) + sizeof(uint16);
 6081                          1050         [ +  - ]:              3 :                     if (ptr2->haspos)
 6018                          1051                 :              3 :                         dataoff += add_pos(in2, ptr2, out, ptr, maxpos) * sizeof(WordEntryPos);
                               1052                 :                :                 }
                               1053                 :                :                 else            /* must have ptr2->haspos */
                               1054                 :                :                 {
 6081 tgl@sss.pgh.pa.us        1055                 :UBC           0 :                     int         addlen = add_pos(in2, ptr2, out, ptr, maxpos);
                               1056                 :                : 
                               1057         [ #  # ]:              0 :                     if (addlen == 0)
                               1058                 :              0 :                         ptr->haspos = 0;
                               1059                 :                :                     else
                               1060                 :                :                     {
 6018                          1061                 :              0 :                         dataoff = SHORTALIGN(dataoff);
                               1062                 :              0 :                         dataoff += addlen * sizeof(WordEntryPos) + sizeof(uint16);
                               1063                 :                :                     }
                               1064                 :                :                 }
                               1065                 :                :             }
                               1066                 :                : 
 6081 tgl@sss.pgh.pa.us        1067                 :CBC           3 :             ptr++;
                               1068                 :              3 :             ptr1++;
                               1069                 :              3 :             ptr2++;
                               1070                 :              3 :             i1--;
                               1071                 :              3 :             i2--;
                               1072                 :                :         }
                               1073                 :                :     }
                               1074                 :                : 
                               1075         [ +  + ]:              9 :     while (i1)
                               1076                 :                :     {
                               1077                 :              3 :         ptr->haspos = ptr1->haspos;
                               1078                 :              3 :         ptr->len = ptr1->len;
 6018                          1079                 :              3 :         memcpy(data + dataoff, data1 + ptr1->pos, ptr1->len);
                               1080                 :              3 :         ptr->pos = dataoff;
                               1081                 :              3 :         dataoff += ptr1->len;
 6081                          1082         [ +  - ]:              3 :         if (ptr->haspos)
                               1083                 :                :         {
 6018                          1084                 :              3 :             dataoff = SHORTALIGN(dataoff);
                               1085         [ +  - ]:              3 :             memcpy(data + dataoff, _POSVECPTR(in1, ptr1), POSDATALEN(in1, ptr1) * sizeof(WordEntryPos) + sizeof(uint16));
                               1086         [ +  - ]:              3 :             dataoff += POSDATALEN(in1, ptr1) * sizeof(WordEntryPos) + sizeof(uint16);
                               1087                 :                :         }
                               1088                 :                : 
 6081                          1089                 :              3 :         ptr++;
                               1090                 :              3 :         ptr1++;
                               1091                 :              3 :         i1--;
                               1092                 :                :     }
                               1093                 :                : 
                               1094         [ +  + ]:              9 :     while (i2)
                               1095                 :                :     {
                               1096                 :              3 :         ptr->haspos = ptr2->haspos;
                               1097                 :              3 :         ptr->len = ptr2->len;
 6018                          1098                 :              3 :         memcpy(data + dataoff, data2 + ptr2->pos, ptr2->len);
                               1099                 :              3 :         ptr->pos = dataoff;
                               1100                 :              3 :         dataoff += ptr2->len;
 6081                          1101         [ +  - ]:              3 :         if (ptr->haspos)
                               1102                 :                :         {
                               1103                 :              3 :             int         addlen = add_pos(in2, ptr2, out, ptr, maxpos);
                               1104                 :                : 
                               1105         [ -  + ]:              3 :             if (addlen == 0)
 6081 tgl@sss.pgh.pa.us        1106                 :UBC           0 :                 ptr->haspos = 0;
                               1107                 :                :             else
                               1108                 :                :             {
 6018 tgl@sss.pgh.pa.us        1109                 :CBC           3 :                 dataoff = SHORTALIGN(dataoff);
                               1110                 :              3 :                 dataoff += addlen * sizeof(WordEntryPos) + sizeof(uint16);
                               1111                 :                :             }
                               1112                 :                :         }
                               1113                 :                : 
 6081                          1114                 :              3 :         ptr++;
                               1115                 :              3 :         ptr2++;
                               1116                 :              3 :         i2--;
                               1117                 :                :     }
                               1118                 :                : 
                               1119                 :                :     /*
                               1120                 :                :      * Instead of checking each offset individually, we check for overflow of
                               1121                 :                :      * pos fields once at the end.
                               1122                 :                :      */
 6018                          1123         [ -  + ]:              6 :     if (dataoff > MAXSTRPOS)
 6018 tgl@sss.pgh.pa.us        1124         [ #  # ]:UBC           0 :         ereport(ERROR,
                               1125                 :                :                 (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),
                               1126                 :                :                  errmsg("string is too long for tsvector (%d bytes, max %d bytes)", dataoff, MAXSTRPOS)));
                               1127                 :                : 
                               1128                 :                :     /*
                               1129                 :                :      * Adjust sizes (asserting that we didn't overrun the original estimates)
                               1130                 :                :      * and collapse out any unused array entries.
                               1131                 :                :      */
 4615 tgl@sss.pgh.pa.us        1132                 :CBC           6 :     output_size = ptr - ARRPTR(out);
                               1133         [ -  + ]:              6 :     Assert(output_size <= out->size);
                               1134                 :              6 :     out->size = output_size;
 6081                          1135         [ +  + ]:              6 :     if (data != STRPTR(out))
 6018                          1136                 :              3 :         memmove(STRPTR(out), data, dataoff);
 4615                          1137                 :              6 :     output_bytes = CALCDATASIZE(out->size, dataoff);
                               1138         [ -  + ]:              6 :     Assert(output_bytes <= VARSIZE(out));
                               1139                 :              6 :     SET_VARSIZE(out, output_bytes);
                               1140                 :                : 
 6081                          1141         [ -  + ]:              6 :     PG_FREE_IF_COPY(in1, 0);
                               1142         [ -  + ]:              6 :     PG_FREE_IF_COPY(in2, 1);
                               1143                 :              6 :     PG_RETURN_POINTER(out);
                               1144                 :                : }
                               1145                 :                : 
                               1146                 :                : /*
                               1147                 :                :  * Compare two strings by tsvector rules.
                               1148                 :                :  *
                               1149                 :                :  * if prefix = true then it returns zero value iff b has prefix a
                               1150                 :                :  */
                               1151                 :                : int32
 5812                          1152                 :        3107789 : tsCompareString(char *a, int lena, char *b, int lenb, bool prefix)
                               1153                 :                : {
                               1154                 :                :     int         cmp;
                               1155                 :                : 
 5421 bruce@momjian.us         1156         [ +  + ]:        3107789 :     if (lena == 0)
                               1157                 :                :     {
                               1158         [ -  + ]:             18 :         if (prefix)
 4844 tgl@sss.pgh.pa.us        1159                 :UBC           0 :             cmp = 0;            /* empty string is prefix of anything */
                               1160                 :                :         else
 5421 bruce@momjian.us         1161         [ +  - ]:CBC          18 :             cmp = (lenb > 0) ? -1 : 0;
                               1162                 :                :     }
                               1163         [ -  + ]:        3107771 :     else if (lenb == 0)
                               1164                 :                :     {
 5421 bruce@momjian.us         1165                 :UBC           0 :         cmp = (lena > 0) ? 1 : 0;
                               1166                 :                :     }
                               1167                 :                :     else
                               1168                 :                :     {
  789 tgl@sss.pgh.pa.us        1169                 :CBC     3107771 :         cmp = memcmp(a, b, Min((unsigned int) lena, (unsigned int) lenb));
                               1170                 :                : 
 5421 bruce@momjian.us         1171         [ +  + ]:        3107771 :         if (prefix)
                               1172                 :                :         {
                               1173   [ +  +  -  + ]:           8229 :             if (cmp == 0 && lena > lenb)
 4844 tgl@sss.pgh.pa.us        1174                 :UBC           0 :                 cmp = 1;        /* a is longer, so not a prefix of b */
                               1175                 :                :         }
 4844 tgl@sss.pgh.pa.us        1176   [ +  +  +  + ]:CBC     3099542 :         else if (cmp == 0 && lena != lenb)
                               1177                 :                :         {
 5812                          1178         [ +  + ]:          16136 :             cmp = (lena < lenb) ? -1 : 1;
                               1179                 :                :         }
                               1180                 :                :     }
                               1181                 :                : 
                               1182                 :        3107789 :     return cmp;
                               1183                 :                : }
                               1184                 :                : 
                               1185                 :                : /*
                               1186                 :                :  * Check weight info or/and fill 'data' with the required positions
                               1187                 :                :  */
                               1188                 :                : static TSTernaryValue
 2929 teodor@sigaev.ru         1189                 :          34041 : checkclass_str(CHKVAL *chkval, WordEntry *entry, QueryOperand *val,
                               1190                 :                :                ExecPhraseData *data)
                               1191                 :                : {
 1360 tgl@sss.pgh.pa.us        1192                 :          34041 :     TSTernaryValue result = TS_NO;
                               1193                 :                : 
                               1194   [ +  +  -  + ]:          34041 :     Assert(data == NULL || data->npos == 0);
                               1195                 :                : 
                               1196         [ +  + ]:          34041 :     if (entry->haspos)
                               1197                 :                :     {
                               1198                 :                :         WordEntryPosVector *posvec;
                               1199                 :                : 
                               1200                 :                :         /*
                               1201                 :                :          * We can't use the _POSVECPTR macro here because the pointer to the
                               1202                 :                :          * tsvector's lexeme storage is already contained in chkval->values.
                               1203                 :                :          */
 2929 teodor@sigaev.ru         1204                 :           2244 :         posvec = (WordEntryPosVector *)
                               1205                 :           2244 :             (chkval->values + SHORTALIGN(entry->pos + entry->len));
                               1206                 :                : 
                               1207   [ +  +  +  + ]:           2244 :         if (val->weight && data)
                               1208                 :             24 :         {
 2866 rhaas@postgresql.org     1209                 :             24 :             WordEntryPos *posvec_iter = posvec->pos;
                               1210                 :                :             WordEntryPos *dptr;
                               1211                 :                : 
                               1212                 :                :             /*
                               1213                 :                :              * Filter position information by weights
                               1214                 :                :              */
 2929 teodor@sigaev.ru         1215                 :             24 :             dptr = data->pos = palloc(sizeof(WordEntryPos) * posvec->npos);
                               1216                 :             24 :             data->allocated = true;
                               1217                 :                : 
                               1218                 :                :             /* Is there a position with a matching weight? */
                               1219         [ +  + ]:             48 :             while (posvec_iter < posvec->pos + posvec->npos)
                               1220                 :                :             {
                               1221                 :                :                 /* If true, append this position to the data->pos */
                               1222         [ +  + ]:             24 :                 if (val->weight & (1 << WEP_GETWEIGHT(*posvec_iter)))
                               1223                 :                :                 {
                               1224                 :             12 :                     *dptr = WEP_GETPOS(*posvec_iter);
                               1225                 :             12 :                     dptr++;
                               1226                 :                :                 }
                               1227                 :                : 
                               1228                 :             24 :                 posvec_iter++;
                               1229                 :                :             }
                               1230                 :                : 
                               1231                 :             24 :             data->npos = dptr - data->pos;
                               1232                 :                : 
                               1233         [ +  + ]:             24 :             if (data->npos > 0)
 1360 tgl@sss.pgh.pa.us        1234                 :             12 :                 result = TS_YES;
                               1235                 :                :             else
                               1236                 :                :             {
                               1237                 :             12 :                 pfree(data->pos);
                               1238                 :             12 :                 data->pos = NULL;
                               1239                 :             12 :                 data->allocated = false;
                               1240                 :                :             }
                               1241                 :                :         }
 2929 teodor@sigaev.ru         1242         [ +  + ]:           2220 :         else if (val->weight)
                               1243                 :                :         {
 2866 rhaas@postgresql.org     1244                 :            228 :             WordEntryPos *posvec_iter = posvec->pos;
                               1245                 :                : 
                               1246                 :                :             /* Is there a position with a matching weight? */
 2929 teodor@sigaev.ru         1247         [ +  + ]:            345 :             while (posvec_iter < posvec->pos + posvec->npos)
                               1248                 :                :             {
                               1249         [ +  + ]:            252 :                 if (val->weight & (1 << WEP_GETWEIGHT(*posvec_iter)))
                               1250                 :                :                 {
 1360 tgl@sss.pgh.pa.us        1251                 :            135 :                     result = TS_YES;
 2866 rhaas@postgresql.org     1252                 :            135 :                     break;      /* no need to go further */
                               1253                 :                :                 }
                               1254                 :                : 
 2929 teodor@sigaev.ru         1255                 :            117 :                 posvec_iter++;
                               1256                 :                :             }
                               1257                 :                :         }
 1360 tgl@sss.pgh.pa.us        1258         [ +  + ]:           1992 :         else if (data)
                               1259                 :                :         {
 2929 teodor@sigaev.ru         1260                 :           1137 :             data->npos = posvec->npos;
 2866 rhaas@postgresql.org     1261                 :           1137 :             data->pos = posvec->pos;
 2929 teodor@sigaev.ru         1262                 :           1137 :             data->allocated = false;
 1360 tgl@sss.pgh.pa.us        1263                 :           1137 :             result = TS_YES;
                               1264                 :                :         }
                               1265                 :                :         else
                               1266                 :                :         {
                               1267                 :                :             /* simplest case: no weight check, positions not needed */
                               1268                 :            855 :             result = TS_YES;
                               1269                 :                :         }
                               1270                 :                :     }
                               1271                 :                :     else
                               1272                 :                :     {
                               1273                 :                :         /*
                               1274                 :                :          * Position info is lacking, so if the caller requires it, we can only
                               1275                 :                :          * say that maybe there is a match.
                               1276                 :                :          *
                               1277                 :                :          * Notice, however, that we *don't* check val->weight here.
                               1278                 :                :          * Historically, stripped tsvectors are considered to match queries
                               1279                 :                :          * whether or not the query has a weight restriction; that's a little
                               1280                 :                :          * dubious but we'll preserve the behavior.
                               1281                 :                :          */
                               1282         [ +  + ]:          31797 :         if (data)
                               1283                 :          11529 :             result = TS_MAYBE;
                               1284                 :                :         else
                               1285                 :          20268 :             result = TS_YES;
                               1286                 :                :     }
                               1287                 :                : 
 2929 teodor@sigaev.ru         1288                 :          34041 :     return result;
                               1289                 :                : }
                               1290                 :                : 
                               1291                 :                : /*
                               1292                 :                :  * TS_execute callback for matching a tsquery operand to plain tsvector data
                               1293                 :                :  */
                               1294                 :                : static TSTernaryValue
                               1295                 :         142011 : checkcondition_str(void *checkval, QueryOperand *val, ExecPhraseData *data)
                               1296                 :                : {
 5995 bruce@momjian.us         1297                 :         142011 :     CHKVAL     *chkval = (CHKVAL *) checkval;
 6064 teodor@sigaev.ru         1298                 :         142011 :     WordEntry  *StopLow = chkval->arrb;
                               1299                 :         142011 :     WordEntry  *StopHigh = chkval->arre;
 5812 tgl@sss.pgh.pa.us        1300                 :         142011 :     WordEntry  *StopMiddle = StopHigh;
 1360                          1301                 :         142011 :     TSTernaryValue res = TS_NO;
                               1302                 :                : 
                               1303                 :                :     /* Loop invariant: StopLow <= val < StopHigh */
 6081                          1304         [ +  + ]:         893403 :     while (StopLow < StopHigh)
                               1305                 :                :     {
                               1306                 :                :         int         difference;
                               1307                 :                : 
                               1308                 :         777915 :         StopMiddle = StopLow + (StopHigh - StopLow) / 2;
 2929 teodor@sigaev.ru         1309                 :         777915 :         difference = tsCompareString(chkval->operand + val->distance,
                               1310                 :         777915 :                                      val->length,
                               1311                 :         777915 :                                      chkval->values + StopMiddle->pos,
                               1312                 :         777915 :                                      StopMiddle->len,
                               1313                 :                :                                      false);
                               1314                 :                : 
 6081 tgl@sss.pgh.pa.us        1315         [ +  + ]:         777915 :         if (difference == 0)
                               1316                 :                :         {
                               1317                 :                :             /* Check weight info & fill 'data' with positions */
 2929 teodor@sigaev.ru         1318                 :          26523 :             res = checkclass_str(chkval, StopMiddle, val, data);
 5812 tgl@sss.pgh.pa.us        1319                 :          26523 :             break;
                               1320                 :                :         }
                               1321         [ +  + ]:         751392 :         else if (difference > 0)
 6081                          1322                 :         423756 :             StopLow = StopMiddle + 1;
                               1323                 :                :         else
                               1324                 :         327636 :             StopHigh = StopMiddle;
                               1325                 :                :     }
                               1326                 :                : 
                               1327                 :                :     /*
                               1328                 :                :      * If it's a prefix search, we should also consider lexemes that the
                               1329                 :                :      * search term is a prefix of (which will necessarily immediately follow
                               1330                 :                :      * the place we found in the above loop).  But we can skip them if there
                               1331                 :                :      * was a definite match on the exact term AND the caller doesn't need
                               1332                 :                :      * position info.
                               1333                 :                :      */
 1360                          1334   [ +  +  +  +  :         142011 :     if (val->prefix && (res != TS_YES || data))
                                              +  - ]
                               1335                 :                :     {
 2866 rhaas@postgresql.org     1336                 :           8262 :         WordEntryPos *allpos = NULL;
                               1337                 :           8262 :         int         npos = 0,
                               1338                 :           8262 :                     totalpos = 0;
                               1339                 :                : 
                               1340                 :                :         /* adjust start position for corner case */
 5421 bruce@momjian.us         1341         [ +  + ]:           8262 :         if (StopLow >= StopHigh)
 5812 tgl@sss.pgh.pa.us        1342                 :           8256 :             StopMiddle = StopHigh;
                               1343                 :                : 
                               1344                 :                :         /* we don't try to re-use any data from the initial match */
 1360                          1345         [ +  + ]:           8262 :         if (data)
                               1346                 :                :         {
                               1347         [ -  + ]:             18 :             if (data->allocated)
 1360 tgl@sss.pgh.pa.us        1348                 :UBC           0 :                 pfree(data->pos);
 1360 tgl@sss.pgh.pa.us        1349                 :CBC          18 :             data->pos = NULL;
                               1350                 :             18 :             data->allocated = false;
                               1351                 :             18 :             data->npos = 0;
                               1352                 :                :         }
                               1353                 :           8262 :         res = TS_NO;
                               1354                 :                : 
                               1355         [ -  + ]:          15729 :         while ((res != TS_YES || data) &&
                               1356   [ +  +  +  +  :          23745 :                StopMiddle < chkval->arre &&
                                              +  + ]
 2929 teodor@sigaev.ru         1357                 :           7965 :                tsCompareString(chkval->operand + val->distance,
                               1358                 :           7965 :                                val->length,
                               1359                 :           7965 :                                chkval->values + StopMiddle->pos,
                               1360                 :           7965 :                                StopMiddle->len,
                               1361                 :                :                                true) == 0)
                               1362                 :                :         {
                               1363                 :                :             TSTernaryValue subres;
                               1364                 :                : 
 1360 tgl@sss.pgh.pa.us        1365                 :           7518 :             subres = checkclass_str(chkval, StopMiddle, val, data);
                               1366                 :                : 
                               1367         [ +  + ]:           7518 :             if (subres != TS_NO)
                               1368                 :                :             {
                               1369         [ +  + ]:           7488 :                 if (data)
                               1370                 :                :                 {
                               1371                 :                :                     /*
                               1372                 :                :                      * We need to join position information
                               1373                 :                :                      */
                               1374         [ -  + ]:             21 :                     if (subres == TS_MAYBE)
                               1375                 :                :                     {
                               1376                 :                :                         /*
                               1377                 :                :                          * No position info for this match, so we must report
                               1378                 :                :                          * MAYBE overall.
                               1379                 :                :                          */
 1360 tgl@sss.pgh.pa.us        1380                 :UBC           0 :                         res = TS_MAYBE;
                               1381                 :                :                         /* forget any previous positions */
                               1382                 :              0 :                         npos = 0;
                               1383                 :                :                         /* don't leak storage */
                               1384         [ #  # ]:              0 :                         if (allpos)
                               1385                 :              0 :                             pfree(allpos);
                               1386                 :              0 :                         break;
                               1387                 :                :                     }
                               1388                 :                : 
 1360 tgl@sss.pgh.pa.us        1389         [ +  + ]:CBC          39 :                     while (npos + data->npos > totalpos)
                               1390                 :                :                     {
 2929 teodor@sigaev.ru         1391         [ +  - ]:             18 :                         if (totalpos == 0)
                               1392                 :                :                         {
                               1393                 :             18 :                             totalpos = 256;
                               1394                 :             18 :                             allpos = palloc(sizeof(WordEntryPos) * totalpos);
                               1395                 :                :                         }
                               1396                 :                :                         else
                               1397                 :                :                         {
 2929 teodor@sigaev.ru         1398                 :UBC           0 :                             totalpos *= 2;
                               1399                 :              0 :                             allpos = repalloc(allpos, sizeof(WordEntryPos) * totalpos);
                               1400                 :                :                         }
                               1401                 :                :                     }
                               1402                 :                : 
 2929 teodor@sigaev.ru         1403                 :CBC          21 :                     memcpy(allpos + npos, data->pos, sizeof(WordEntryPos) * data->npos);
                               1404                 :             21 :                     npos += data->npos;
                               1405                 :                : 
                               1406                 :                :                     /* don't leak storage from individual matches */
 1360 tgl@sss.pgh.pa.us        1407         [ +  + ]:             21 :                     if (data->allocated)
                               1408                 :             12 :                         pfree(data->pos);
                               1409                 :             21 :                     data->pos = NULL;
                               1410                 :             21 :                     data->allocated = false;
                               1411                 :                :                     /* it's important to reset data->npos before next loop */
                               1412                 :             21 :                     data->npos = 0;
                               1413                 :                :                 }
                               1414                 :                :                 else
                               1415                 :                :                 {
                               1416                 :                :                     /* Don't need positions, just handle YES/MAYBE */
                               1417   [ -  +  -  - ]:           7467 :                     if (subres == TS_YES || res == TS_NO)
                               1418                 :           7467 :                         res = subres;
                               1419                 :                :                 }
                               1420                 :                :             }
                               1421                 :                : 
 5812                          1422                 :           7518 :             StopMiddle++;
                               1423                 :                :         }
                               1424                 :                : 
 1360                          1425   [ +  +  +  - ]:           8262 :         if (data && npos > 0)
                               1426                 :                :         {
                               1427                 :                :             /* Sort and make unique array of found positions */
 2929 teodor@sigaev.ru         1428                 :             18 :             data->pos = allpos;
 1620 tmunro@postgresql.or     1429                 :             18 :             qsort(data->pos, npos, sizeof(WordEntryPos), compareWordEntryPos);
                               1430                 :             18 :             data->npos = qunique(data->pos, npos, sizeof(WordEntryPos),
                               1431                 :                :                                  compareWordEntryPos);
 2929 teodor@sigaev.ru         1432                 :             18 :             data->allocated = true;
 1360 tgl@sss.pgh.pa.us        1433                 :             18 :             res = TS_YES;
                               1434                 :                :         }
                               1435                 :                :     }
                               1436                 :                : 
 5421 bruce@momjian.us         1437                 :         142011 :     return res;
                               1438                 :                : }
                               1439                 :                : 
                               1440                 :                : /*
                               1441                 :                :  * Compute output position list for a tsquery operator in phrase mode.
                               1442                 :                :  *
                               1443                 :                :  * Merge the position lists in Ldata and Rdata as specified by "emit",
                               1444                 :                :  * returning the result list into *data.  The input position lists must be
                               1445                 :                :  * sorted and unique, and the output will be as well.
                               1446                 :                :  *
                               1447                 :                :  * data: pointer to initially-all-zeroes output struct, or NULL
                               1448                 :                :  * Ldata, Rdata: input position lists
                               1449                 :                :  * emit: bitmask of TSPO_XXX flags
                               1450                 :                :  * Loffset: offset to be added to Ldata positions before comparing/outputting
                               1451                 :                :  * Roffset: offset to be added to Rdata positions before comparing/outputting
                               1452                 :                :  * max_npos: maximum possible required size of output position array
                               1453                 :                :  *
                               1454                 :                :  * Loffset and Roffset should not be negative, else we risk trying to output
                               1455                 :                :  * negative positions, which won't fit into WordEntryPos.
                               1456                 :                :  *
                               1457                 :                :  * The result is boolean (TS_YES or TS_NO), but for the caller's convenience
                               1458                 :                :  * we return it as TSTernaryValue.
                               1459                 :                :  *
                               1460                 :                :  * Returns TS_YES if any positions were emitted to *data; or if data is NULL,
                               1461                 :                :  * returns TS_YES if any positions would have been emitted.
                               1462                 :                :  */
                               1463                 :                : #define TSPO_L_ONLY     0x01    /* emit positions appearing only in L */
                               1464                 :                : #define TSPO_R_ONLY     0x02    /* emit positions appearing only in R */
                               1465                 :                : #define TSPO_BOTH       0x04    /* emit positions appearing in both L&R */
                               1466                 :                : 
                               1467                 :                : static TSTernaryValue
 2671 tgl@sss.pgh.pa.us        1468                 :          14984 : TS_phrase_output(ExecPhraseData *data,
                               1469                 :                :                  ExecPhraseData *Ldata,
                               1470                 :                :                  ExecPhraseData *Rdata,
                               1471                 :                :                  int emit,
                               1472                 :                :                  int Loffset,
                               1473                 :                :                  int Roffset,
                               1474                 :                :                  int max_npos)
                               1475                 :                : {
                               1476                 :                :     int         Lindex,
                               1477                 :                :                 Rindex;
                               1478                 :                : 
                               1479                 :                :     /* Loop until both inputs are exhausted */
                               1480                 :          14984 :     Lindex = Rindex = 0;
                               1481   [ +  +  +  + ]:          15500 :     while (Lindex < Ldata->npos || Rindex < Rdata->npos)
                               1482                 :                :     {
                               1483                 :                :         int         Lpos,
                               1484                 :                :                     Rpos;
                               1485                 :           1167 :         int         output_pos = 0;
                               1486                 :                : 
                               1487                 :                :         /*
                               1488                 :                :          * Fetch current values to compare.  WEP_GETPOS() is needed because
                               1489                 :                :          * ExecPhraseData->data can point to a tsvector's WordEntryPosVector.
                               1490                 :                :          */
                               1491         [ +  + ]:           1167 :         if (Lindex < Ldata->npos)
                               1492                 :            843 :             Lpos = WEP_GETPOS(Ldata->pos[Lindex]) + Loffset;
                               1493                 :                :         else
                               1494                 :                :         {
                               1495                 :                :             /* L array exhausted, so we're done if R_ONLY isn't set */
                               1496         [ +  + ]:            324 :             if (!(emit & TSPO_R_ONLY))
                               1497                 :             75 :                 break;
                               1498                 :            249 :             Lpos = INT_MAX;
                               1499                 :                :         }
                               1500         [ +  + ]:           1092 :         if (Rindex < Rdata->npos)
                               1501                 :            969 :             Rpos = WEP_GETPOS(Rdata->pos[Rindex]) + Roffset;
                               1502                 :                :         else
                               1503                 :                :         {
                               1504                 :                :             /* R array exhausted, so we're done if L_ONLY isn't set */
                               1505         [ +  + ]:            123 :             if (!(emit & TSPO_L_ONLY))
                               1506                 :             81 :                 break;
                               1507                 :             42 :             Rpos = INT_MAX;
                               1508                 :                :         }
                               1509                 :                : 
                               1510                 :                :         /* Merge-join the two input lists */
                               1511         [ +  + ]:           1011 :         if (Lpos < Rpos)
                               1512                 :                :         {
                               1513                 :                :             /* Lpos is not matched in Rdata, should we output it? */
                               1514         [ +  + ]:            243 :             if (emit & TSPO_L_ONLY)
                               1515                 :             72 :                 output_pos = Lpos;
                               1516                 :            243 :             Lindex++;
                               1517                 :                :         }
                               1518         [ +  + ]:            768 :         else if (Lpos == Rpos)
                               1519                 :                :         {
                               1520                 :                :             /* Lpos and Rpos match ... should we output it? */
                               1521         [ +  + ]:            399 :             if (emit & TSPO_BOTH)
                               1522                 :            351 :                 output_pos = Rpos;
                               1523                 :            399 :             Lindex++;
                               1524                 :            399 :             Rindex++;
                               1525                 :                :         }
                               1526                 :                :         else                    /* Lpos > Rpos */
                               1527                 :                :         {
                               1528                 :                :             /* Rpos is not matched in Ldata, should we output it? */
                               1529         [ +  + ]:            369 :             if (emit & TSPO_R_ONLY)
                               1530                 :            270 :                 output_pos = Rpos;
                               1531                 :            369 :             Rindex++;
                               1532                 :                :         }
                               1533                 :                : 
                               1534         [ +  + ]:           1011 :         if (output_pos > 0)
                               1535                 :                :         {
                               1536         [ +  + ]:            693 :             if (data)
                               1537                 :                :             {
                               1538                 :                :                 /* Store position, first allocating output array if needed */
                               1539         [ +  + ]:            198 :                 if (data->pos == NULL)
                               1540                 :                :                 {
                               1541                 :            159 :                     data->pos = (WordEntryPos *)
                               1542                 :            159 :                         palloc(max_npos * sizeof(WordEntryPos));
                               1543                 :            159 :                     data->allocated = true;
                               1544                 :                :                 }
                               1545                 :            198 :                 data->pos[data->npos++] = output_pos;
                               1546                 :                :             }
                               1547                 :                :             else
                               1548                 :                :             {
                               1549                 :                :                 /*
                               1550                 :                :                  * Exact positions not needed, so return TS_YES as soon as we
                               1551                 :                :                  * know there is at least one.
                               1552                 :                :                  */
 1448                          1553                 :            495 :                 return TS_YES;
                               1554                 :                :             }
                               1555                 :                :         }
                               1556                 :                :     }
                               1557                 :                : 
 2671                          1558   [ +  +  +  + ]:          14489 :     if (data && data->npos > 0)
                               1559                 :                :     {
                               1560                 :                :         /* Let's assert we didn't overrun the array */
                               1561         [ -  + ]:            159 :         Assert(data->npos <= max_npos);
 1448                          1562                 :            159 :         return TS_YES;
                               1563                 :                :     }
                               1564                 :          14330 :     return TS_NO;
                               1565                 :                : }
                               1566                 :                : 
                               1567                 :                : /*
                               1568                 :                :  * Execute tsquery at or below an OP_PHRASE operator.
                               1569                 :                :  *
                               1570                 :                :  * This handles tsquery execution at recursion levels where we need to care
                               1571                 :                :  * about match locations.
                               1572                 :                :  *
                               1573                 :                :  * In addition to the same arguments used for TS_execute, the caller may pass
                               1574                 :                :  * a preinitialized-to-zeroes ExecPhraseData struct, to be filled with lexeme
                               1575                 :                :  * match position info on success.  data == NULL if no position data need be
                               1576                 :                :  * returned.
                               1577                 :                :  * Note: the function assumes data != NULL for operators other than OP_PHRASE.
                               1578                 :                :  * This is OK because an outside call always starts from an OP_PHRASE node,
                               1579                 :                :  * and all internal recursion cases pass data != NULL.
                               1580                 :                :  *
                               1581                 :                :  * The detailed semantics of the match data, given that the function returned
                               1582                 :                :  * TS_YES (successful match), are:
                               1583                 :                :  *
                               1584                 :                :  * npos > 0, negate = false:
                               1585                 :                :  *   query is matched at specified position(s) (and only those positions)
                               1586                 :                :  * npos > 0, negate = true:
                               1587                 :                :  *   query is matched at all positions *except* specified position(s)
                               1588                 :                :  * npos = 0, negate = true:
                               1589                 :                :  *   query is matched at all positions
                               1590                 :                :  * npos = 0, negate = false:
                               1591                 :                :  *   disallowed (this should result in TS_NO or TS_MAYBE, as appropriate)
                               1592                 :                :  *
                               1593                 :                :  * Successful matches also return a "width" value which is the match width in
                               1594                 :                :  * lexemes, less one.  Hence, "width" is zero for simple one-lexeme matches,
                               1595                 :                :  * and is the sum of the phrase operator distances for phrase matches.  Note
                               1596                 :                :  * that when width > 0, the listed positions represent the ends of matches not
                               1597                 :                :  * the starts.  (This unintuitive rule is needed to avoid possibly generating
                               1598                 :                :  * negative positions, which wouldn't fit into the WordEntryPos arrays.)
                               1599                 :                :  *
                               1600                 :                :  * If the TSExecuteCallback function reports that an operand is present
                               1601                 :                :  * but fails to provide position(s) for it, we will return TS_MAYBE when
                               1602                 :                :  * it is possible but not certain that the query is matched.
                               1603                 :                :  *
                               1604                 :                :  * When the function returns TS_NO or TS_MAYBE, it must return npos = 0,
                               1605                 :                :  * negate = false (which is the state initialized by the caller); but the
                               1606                 :                :  * "width" output in such cases is undefined.
                               1607                 :                :  */
                               1608                 :                : static TSTernaryValue
 2676                          1609                 :         351039 : TS_phrase_execute(QueryItem *curitem, void *arg, uint32 flags,
                               1610                 :                :                   TSExecuteCallback chkcond,
                               1611                 :                :                   ExecPhraseData *data)
                               1612                 :                : {
                               1613                 :                :     ExecPhraseData Ldata,
                               1614                 :                :                 Rdata;
                               1615                 :                :     TSTernaryValue lmatch,
                               1616                 :                :                 rmatch;
                               1617                 :                :     int         Loffset,
                               1618                 :                :                 Roffset,
                               1619                 :                :                 maxwidth;
                               1620                 :                : 
                               1621                 :                :     /* since this function recurses, it could be driven to stack overflow */
 2929 teodor@sigaev.ru         1622                 :         351039 :     check_stack_depth();
                               1623                 :                : 
                               1624                 :                :     /* ... and let's check for query cancel while we're at it */
  510 tgl@sss.pgh.pa.us        1625         [ -  + ]:         351039 :     CHECK_FOR_INTERRUPTS();
                               1626                 :                : 
 2929 teodor@sigaev.ru         1627         [ +  + ]:         351039 :     if (curitem->type == QI_VAL)
 1360 tgl@sss.pgh.pa.us        1628                 :         172677 :         return chkcond(arg, (QueryOperand *) curitem, data);
                               1629                 :                : 
 2671                          1630   [ +  +  +  - ]:         178362 :     switch (curitem->qoperator.oper)
                               1631                 :                :     {
                               1632                 :          60410 :         case OP_NOT:
                               1633                 :                : 
                               1634                 :                :             /*
                               1635                 :                :              * We need not touch data->width, since a NOT operation does not
                               1636                 :                :              * change the match width.
                               1637                 :                :              */
 1360                          1638         [ -  + ]:          60410 :             if (flags & TS_EXEC_SKIP_NOT)
                               1639                 :                :             {
                               1640                 :                :                 /* with SKIP_NOT, report NOT as "match everywhere" */
 2671 tgl@sss.pgh.pa.us        1641   [ #  #  #  # ]:UBC           0 :                 Assert(data->npos == 0 && !data->negate);
                               1642                 :              0 :                 data->negate = true;
 1448                          1643                 :              0 :                 return TS_YES;
                               1644                 :                :             }
 1448 tgl@sss.pgh.pa.us        1645                 :CBC       60410 :             switch (TS_phrase_execute(curitem + 1, arg, flags, chkcond, data))
                               1646                 :                :             {
                               1647                 :          52807 :                 case TS_NO:
                               1648                 :                :                     /* change "match nowhere" to "match everywhere" */
                               1649   [ +  -  -  + ]:          52807 :                     Assert(data->npos == 0 && !data->negate);
                               1650                 :          52807 :                     data->negate = true;
                               1651                 :          52807 :                     return TS_YES;
                               1652                 :            195 :                 case TS_YES:
                               1653         [ +  + ]:            195 :                     if (data->npos > 0)
                               1654                 :                :                     {
                               1655                 :                :                         /* we have some positions, invert negate flag */
                               1656                 :            192 :                         data->negate = !data->negate;
                               1657                 :            192 :                         return TS_YES;
                               1658                 :                :                     }
                               1659         [ +  - ]:              3 :                     else if (data->negate)
                               1660                 :                :                     {
                               1661                 :                :                         /* change "match everywhere" to "match nowhere" */
                               1662                 :              3 :                         data->negate = false;
                               1663                 :              3 :                         return TS_NO;
                               1664                 :                :                     }
                               1665                 :                :                     /* Should not get here if result was TS_YES */
 1448 tgl@sss.pgh.pa.us        1666                 :UBC           0 :                     Assert(false);
                               1667                 :                :                     break;
 1448 tgl@sss.pgh.pa.us        1668                 :CBC        7408 :                 case TS_MAYBE:
                               1669                 :                :                     /* match positions are, and remain, uncertain */
                               1670                 :           7408 :                     return TS_MAYBE;
                               1671                 :                :             }
 1448 tgl@sss.pgh.pa.us        1672                 :UBC           0 :             break;
                               1673                 :                : 
 2671 tgl@sss.pgh.pa.us        1674                 :CBC      117874 :         case OP_PHRASE:
                               1675                 :                :         case OP_AND:
                               1676                 :         117874 :             memset(&Ldata, 0, sizeof(Ldata));
                               1677                 :         117874 :             memset(&Rdata, 0, sizeof(Rdata));
                               1678                 :                : 
 1448                          1679                 :         117874 :             lmatch = TS_phrase_execute(curitem + curitem->qoperator.left,
                               1680                 :                :                                        arg, flags, chkcond, &Ldata);
                               1681         [ +  + ]:         117874 :             if (lmatch == TS_NO)
                               1682                 :          63023 :                 return TS_NO;
                               1683                 :                : 
                               1684                 :          54851 :             rmatch = TS_phrase_execute(curitem + 1,
                               1685                 :                :                                        arg, flags, chkcond, &Rdata);
                               1686         [ +  + ]:          54851 :             if (rmatch == TS_NO)
                               1687                 :          27050 :                 return TS_NO;
                               1688                 :                : 
                               1689                 :                :             /*
                               1690                 :                :              * If either operand has no position information, then we can't
                               1691                 :                :              * return reliable position data, only a MAYBE result.
                               1692                 :                :              */
                               1693   [ +  +  +  + ]:          27801 :             if (lmatch == TS_MAYBE || rmatch == TS_MAYBE)
                               1694                 :          12895 :                 return TS_MAYBE;
                               1695                 :                : 
 2671                          1696         [ +  + ]:          14906 :             if (curitem->qoperator.oper == OP_PHRASE)
                               1697                 :                :             {
                               1698                 :                :                 /*
                               1699                 :                :                  * Compute Loffset and Roffset suitable for phrase match, and
                               1700                 :                :                  * compute overall width of whole phrase match.
                               1701                 :                :                  */
                               1702                 :          14903 :                 Loffset = curitem->qoperator.distance + Rdata.width;
                               1703                 :          14903 :                 Roffset = 0;
                               1704         [ +  + ]:          14903 :                 if (data)
                               1705                 :             93 :                     data->width = curitem->qoperator.distance +
                               1706                 :             93 :                         Ldata.width + Rdata.width;
                               1707                 :                :             }
                               1708                 :                :             else
                               1709                 :                :             {
                               1710                 :                :                 /*
                               1711                 :                :                  * For OP_AND, set output width and alignment like OP_OR (see
                               1712                 :                :                  * comment below)
                               1713                 :                :                  */
                               1714                 :              3 :                 maxwidth = Max(Ldata.width, Rdata.width);
                               1715                 :              3 :                 Loffset = maxwidth - Ldata.width;
                               1716                 :              3 :                 Roffset = maxwidth - Rdata.width;
                               1717         [ +  - ]:              3 :                 if (data)
                               1718                 :              3 :                     data->width = maxwidth;
                               1719                 :                :             }
                               1720                 :                : 
                               1721   [ +  +  +  + ]:          14906 :             if (Ldata.negate && Rdata.negate)
                               1722                 :                :             {
                               1723                 :                :                 /* !L & !R: treat as !(L | R) */
                               1724                 :          14219 :                 (void) TS_phrase_output(data, &Ldata, &Rdata,
                               1725                 :                :                                         TSPO_BOTH | TSPO_L_ONLY | TSPO_R_ONLY,
                               1726                 :                :                                         Loffset, Roffset,
                               1727                 :          14219 :                                         Ldata.npos + Rdata.npos);
                               1728         [ -  + ]:          14219 :                 if (data)
 2671 tgl@sss.pgh.pa.us        1729                 :UBC           0 :                     data->negate = true;
 1448 tgl@sss.pgh.pa.us        1730                 :CBC       14219 :                 return TS_YES;
                               1731                 :                :             }
 2671                          1732         [ +  + ]:            687 :             else if (Ldata.negate)
                               1733                 :                :             {
                               1734                 :                :                 /* !L & R */
                               1735                 :            225 :                 return TS_phrase_output(data, &Ldata, &Rdata,
                               1736                 :                :                                         TSPO_R_ONLY,
                               1737                 :                :                                         Loffset, Roffset,
                               1738                 :                :                                         Rdata.npos);
                               1739                 :                :             }
                               1740         [ +  + ]:            462 :             else if (Rdata.negate)
                               1741                 :                :             {
                               1742                 :                :                 /* L & !R */
                               1743                 :              3 :                 return TS_phrase_output(data, &Ldata, &Rdata,
                               1744                 :                :                                         TSPO_L_ONLY,
                               1745                 :                :                                         Loffset, Roffset,
                               1746                 :                :                                         Ldata.npos);
                               1747                 :                :             }
                               1748                 :                :             else
                               1749                 :                :             {
                               1750                 :                :                 /* straight AND */
                               1751                 :            459 :                 return TS_phrase_output(data, &Ldata, &Rdata,
                               1752                 :                :                                         TSPO_BOTH,
                               1753                 :                :                                         Loffset, Roffset,
                               1754                 :            459 :                                         Min(Ldata.npos, Rdata.npos));
                               1755                 :                :             }
                               1756                 :                : 
                               1757                 :             78 :         case OP_OR:
                               1758                 :             78 :             memset(&Ldata, 0, sizeof(Ldata));
                               1759                 :             78 :             memset(&Rdata, 0, sizeof(Rdata));
                               1760                 :                : 
                               1761                 :             78 :             lmatch = TS_phrase_execute(curitem + curitem->qoperator.left,
                               1762                 :                :                                        arg, flags, chkcond, &Ldata);
                               1763                 :             78 :             rmatch = TS_phrase_execute(curitem + 1,
                               1764                 :                :                                        arg, flags, chkcond, &Rdata);
                               1765                 :                : 
 1448                          1766   [ +  +  +  + ]:             78 :             if (lmatch == TS_NO && rmatch == TS_NO)
                               1767                 :              6 :                 return TS_NO;
                               1768                 :                : 
                               1769                 :                :             /*
                               1770                 :                :              * If either operand has no position information, then we can't
                               1771                 :                :              * return reliable position data, only a MAYBE result.
                               1772                 :                :              */
                               1773   [ +  -  -  + ]:             72 :             if (lmatch == TS_MAYBE || rmatch == TS_MAYBE)
 1448 tgl@sss.pgh.pa.us        1774                 :UBC           0 :                 return TS_MAYBE;
                               1775                 :                : 
                               1776                 :                :             /*
                               1777                 :                :              * Cope with undefined output width from failed submatch.  (This
                               1778                 :                :              * takes less code than trying to ensure that all failure returns
                               1779                 :                :              * set data->width to zero.)
                               1780                 :                :              */
 1448 tgl@sss.pgh.pa.us        1781         [ +  + ]:CBC          72 :             if (lmatch == TS_NO)
 2671                          1782                 :              9 :                 Ldata.width = 0;
 1448                          1783         [ +  + ]:             72 :             if (rmatch == TS_NO)
 2671                          1784                 :             42 :                 Rdata.width = 0;
                               1785                 :                : 
                               1786                 :                :             /*
                               1787                 :                :              * For OP_AND and OP_OR, report the width of the wider of the two
                               1788                 :                :              * inputs, and align the narrower input's positions to the right
                               1789                 :                :              * end of that width.  This rule deals at least somewhat
                               1790                 :                :              * reasonably with cases like "x <-> (y | z <-> q)".
                               1791                 :                :              */
                               1792                 :             72 :             maxwidth = Max(Ldata.width, Rdata.width);
                               1793                 :             72 :             Loffset = maxwidth - Ldata.width;
                               1794                 :             72 :             Roffset = maxwidth - Rdata.width;
                               1795                 :             72 :             data->width = maxwidth;
                               1796                 :                : 
                               1797   [ +  +  +  + ]:             72 :             if (Ldata.negate && Rdata.negate)
                               1798                 :                :             {
                               1799                 :                :                 /* !L | !R: treat as !(L & R) */
                               1800                 :              3 :                 (void) TS_phrase_output(data, &Ldata, &Rdata,
                               1801                 :                :                                         TSPO_BOTH,
                               1802                 :                :                                         Loffset, Roffset,
                               1803                 :              3 :                                         Min(Ldata.npos, Rdata.npos));
                               1804                 :              3 :                 data->negate = true;
 1448                          1805                 :              3 :                 return TS_YES;
                               1806                 :                :             }
 2671                          1807         [ +  + ]:             69 :             else if (Ldata.negate)
                               1808                 :                :             {
                               1809                 :                :                 /* !L | R: treat as !(L & !R) */
                               1810                 :             15 :                 (void) TS_phrase_output(data, &Ldata, &Rdata,
                               1811                 :                :                                         TSPO_L_ONLY,
                               1812                 :                :                                         Loffset, Roffset,
                               1813                 :                :                                         Ldata.npos);
                               1814                 :             15 :                 data->negate = true;
 1448                          1815                 :             15 :                 return TS_YES;
                               1816                 :                :             }
 2671                          1817         [ +  + ]:             54 :             else if (Rdata.negate)
                               1818                 :                :             {
                               1819                 :                :                 /* L | !R: treat as !(!L & R) */
                               1820                 :              3 :                 (void) TS_phrase_output(data, &Ldata, &Rdata,
                               1821                 :                :                                         TSPO_R_ONLY,
                               1822                 :                :                                         Loffset, Roffset,
                               1823                 :                :                                         Rdata.npos);
                               1824                 :              3 :                 data->negate = true;
 1448                          1825                 :              3 :                 return TS_YES;
                               1826                 :                :             }
                               1827                 :                :             else
                               1828                 :                :             {
                               1829                 :                :                 /* straight OR */
 2671                          1830                 :             51 :                 return TS_phrase_output(data, &Ldata, &Rdata,
                               1831                 :                :                                         TSPO_BOTH | TSPO_L_ONLY | TSPO_R_ONLY,
                               1832                 :                :                                         Loffset, Roffset,
                               1833                 :             51 :                                         Ldata.npos + Rdata.npos);
                               1834                 :                :             }
                               1835                 :                : 
 2671 tgl@sss.pgh.pa.us        1836                 :UBC           0 :         default:
                               1837         [ #  # ]:              0 :             elog(ERROR, "unrecognized operator: %d", curitem->qoperator.oper);
                               1838                 :                :     }
                               1839                 :                : 
                               1840                 :                :     /* not reachable, but keep compiler quiet */
 1448                          1841                 :              0 :     return TS_NO;
                               1842                 :                : }
                               1843                 :                : 
                               1844                 :                : 
                               1845                 :                : /*
                               1846                 :                :  * Evaluate tsquery boolean expression.
                               1847                 :                :  *
                               1848                 :                :  * curitem: current tsquery item (initially, the first one)
                               1849                 :                :  * arg: opaque value to pass through to callback function
                               1850                 :                :  * flags: bitmask of flag bits shown in ts_utils.h
                               1851                 :                :  * chkcond: callback function to check whether a primitive value is present
                               1852                 :                :  */
                               1853                 :                : bool
 2676 tgl@sss.pgh.pa.us        1854                 :CBC      260538 : TS_execute(QueryItem *curitem, void *arg, uint32 flags,
                               1855                 :                :            TSExecuteCallback chkcond)
                               1856                 :                : {
                               1857                 :                :     /*
                               1858                 :                :      * If we get TS_MAYBE from the recursion, return true.  We could only see
                               1859                 :                :      * that result if the caller passed TS_EXEC_PHRASE_NO_POS, so there's no
                               1860                 :                :      * need to check again.
                               1861                 :                :      */
 1448                          1862                 :         260538 :     return TS_execute_recurse(curitem, arg, flags, chkcond) != TS_NO;
                               1863                 :                : }
                               1864                 :                : 
                               1865                 :                : /*
                               1866                 :                :  * Evaluate tsquery boolean expression.
                               1867                 :                :  *
                               1868                 :                :  * This is the same as TS_execute except that TS_MAYBE is returned as-is.
                               1869                 :                :  */
                               1870                 :                : TSTernaryValue
 1153                          1871                 :          18471 : TS_execute_ternary(QueryItem *curitem, void *arg, uint32 flags,
                               1872                 :                :                    TSExecuteCallback chkcond)
                               1873                 :                : {
                               1874                 :          18471 :     return TS_execute_recurse(curitem, arg, flags, chkcond);
                               1875                 :                : }
                               1876                 :                : 
                               1877                 :                : /*
                               1878                 :                :  * TS_execute recursion for operators above any phrase operator.  Here we do
                               1879                 :                :  * not need to worry about lexeme positions.  As soon as we hit an OP_PHRASE
                               1880                 :                :  * operator, we pass it off to TS_phrase_execute which does worry.
                               1881                 :                :  */
                               1882                 :                : static TSTernaryValue
 1448                          1883                 :         527912 : TS_execute_recurse(QueryItem *curitem, void *arg, uint32 flags,
                               1884                 :                :                    TSExecuteCallback chkcond)
                               1885                 :                : {
                               1886                 :                :     TSTernaryValue lmatch;
                               1887                 :                : 
                               1888                 :                :     /* since this function recurses, it could be driven to stack overflow */
 6071                          1889                 :         527912 :     check_stack_depth();
                               1890                 :                : 
                               1891                 :                :     /* ... and let's check for query cancel while we're at it */
 1353                          1892         [ -  + ]:         527912 :     CHECK_FOR_INTERRUPTS();
                               1893                 :                : 
 6064 teodor@sigaev.ru         1894         [ +  + ]:         527912 :     if (curitem->type == QI_VAL)
 2676 tgl@sss.pgh.pa.us        1895                 :         212259 :         return chkcond(arg, (QueryOperand *) curitem,
                               1896                 :                :                        NULL /* don't need position info */ );
                               1897                 :                : 
 5386 peter_e@gmx.net          1898   [ +  +  +  +  :         315653 :     switch (curitem->qoperator.oper)
                                                 - ]
                               1899                 :                :     {
 6064 teodor@sigaev.ru         1900                 :         101616 :         case OP_NOT:
 1360 tgl@sss.pgh.pa.us        1901         [ -  + ]:         101616 :             if (flags & TS_EXEC_SKIP_NOT)
 1448 tgl@sss.pgh.pa.us        1902                 :UBC           0 :                 return TS_YES;
 1448 tgl@sss.pgh.pa.us        1903                 :CBC      101616 :             switch (TS_execute_recurse(curitem + 1, arg, flags, chkcond))
                               1904                 :                :             {
                               1905                 :          95852 :                 case TS_NO:
                               1906                 :          95852 :                     return TS_YES;
                               1907                 :           2445 :                 case TS_YES:
                               1908                 :           2445 :                     return TS_NO;
                               1909                 :           3319 :                 case TS_MAYBE:
                               1910                 :           3319 :                     return TS_MAYBE;
                               1911                 :                :             }
 1448 tgl@sss.pgh.pa.us        1912                 :UBC           0 :             break;
                               1913                 :                : 
 6064 teodor@sigaev.ru         1914                 :CBC       41848 :         case OP_AND:
 1448 tgl@sss.pgh.pa.us        1915                 :          41848 :             lmatch = TS_execute_recurse(curitem + curitem->qoperator.left, arg,
                               1916                 :                :                                         flags, chkcond);
                               1917         [ +  + ]:          41848 :             if (lmatch == TS_NO)
                               1918                 :          33261 :                 return TS_NO;
                               1919                 :           8587 :             switch (TS_execute_recurse(curitem + 1, arg, flags, chkcond))
                               1920                 :                :             {
                               1921                 :           5049 :                 case TS_NO:
                               1922                 :           5049 :                     return TS_NO;
                               1923                 :           1650 :                 case TS_YES:
                               1924                 :           1650 :                     return lmatch;
                               1925                 :           1888 :                 case TS_MAYBE:
                               1926                 :           1888 :                     return TS_MAYBE;
                               1927                 :                :             }
 1448 tgl@sss.pgh.pa.us        1928                 :UBC           0 :             break;
                               1929                 :                : 
 6064 teodor@sigaev.ru         1930                 :CBC       54471 :         case OP_OR:
 1448 tgl@sss.pgh.pa.us        1931                 :          54471 :             lmatch = TS_execute_recurse(curitem + curitem->qoperator.left, arg,
                               1932                 :                :                                         flags, chkcond);
                               1933         [ +  + ]:          54471 :             if (lmatch == TS_YES)
                               1934                 :          12090 :                 return TS_YES;
                               1935                 :          42381 :             switch (TS_execute_recurse(curitem + 1, arg, flags, chkcond))
                               1936                 :                :             {
                               1937                 :          28753 :                 case TS_NO:
                               1938                 :          28753 :                     return lmatch;
                               1939                 :           3708 :                 case TS_YES:
                               1940                 :           3708 :                     return TS_YES;
                               1941                 :           9920 :                 case TS_MAYBE:
                               1942                 :           9920 :                     return TS_MAYBE;
                               1943                 :                :             }
 1448 tgl@sss.pgh.pa.us        1944                 :UBC           0 :             break;
                               1945                 :                : 
 2929 teodor@sigaev.ru         1946                 :CBC      117718 :         case OP_PHRASE:
                               1947                 :                : 
                               1948                 :                :             /*
                               1949                 :                :              * If we get a MAYBE result, and the caller doesn't want that,
                               1950                 :                :              * convert it to NO.  It would be more consistent, perhaps, to
                               1951                 :                :              * return the result of TS_phrase_execute() verbatim and then
                               1952                 :                :              * convert MAYBE results at the top of the recursion.  But
                               1953                 :                :              * converting at the topmost phrase operator gives results that
                               1954                 :                :              * are bug-compatible with the old implementation, so do it like
                               1955                 :                :              * this for now.
                               1956                 :                :              */
 1448 tgl@sss.pgh.pa.us        1957                 :         117718 :             switch (TS_phrase_execute(curitem, arg, flags, chkcond, NULL))
                               1958                 :                :             {
                               1959                 :          90169 :                 case TS_NO:
                               1960                 :          90169 :                     return TS_NO;
                               1961                 :          14657 :                 case TS_YES:
                               1962                 :          14657 :                     return TS_YES;
                               1963                 :          12892 :                 case TS_MAYBE:
                               1964                 :          12892 :                     return (flags & TS_EXEC_PHRASE_NO_POS) ? TS_MAYBE : TS_NO;
                               1965                 :                :             }
 1448 tgl@sss.pgh.pa.us        1966                 :UBC           0 :             break;
                               1967                 :                : 
 6064 teodor@sigaev.ru         1968                 :              0 :         default:
 5386 peter_e@gmx.net          1969         [ #  # ]:              0 :             elog(ERROR, "unrecognized operator: %d", curitem->qoperator.oper);
                               1970                 :                :     }
                               1971                 :                : 
                               1972                 :                :     /* not reachable, but keep compiler quiet */
 1448 tgl@sss.pgh.pa.us        1973                 :              0 :     return TS_NO;
                               1974                 :                : }
                               1975                 :                : 
                               1976                 :                : /*
                               1977                 :                :  * Evaluate tsquery and report locations of matching terms.
                               1978                 :                :  *
                               1979                 :                :  * This is like TS_execute except that it returns match locations not just
                               1980                 :                :  * success/failure status.  The callback function is required to provide
                               1981                 :                :  * position data (we report failure if it doesn't).
                               1982                 :                :  *
                               1983                 :                :  * On successful match, the result is a List of ExecPhraseData structs, one
                               1984                 :                :  * for each AND'ed term or phrase operator in the query.  Each struct includes
                               1985                 :                :  * a sorted array of lexeme positions matching that term.  (Recall that for
                               1986                 :                :  * phrase operators, the match includes width+1 lexemes, and the recorded
                               1987                 :                :  * position is that of the rightmost lexeme.)
                               1988                 :                :  *
                               1989                 :                :  * OR subexpressions are handled by union'ing their match locations into a
                               1990                 :                :  * single List element, which is valid since any of those locations contains
                               1991                 :                :  * a match.  However, when some of the OR'ed terms are phrase operators, we
                               1992                 :                :  * report the maximum width of any of the OR'ed terms, making such cases
                               1993                 :                :  * slightly imprecise in the conservative direction.  (For example, if the
                               1994                 :                :  * tsquery is "(A <-> B) | C", an occurrence of C in the data would be
                               1995                 :                :  * reported as though it includes the lexeme to the left of C.)
                               1996                 :                :  *
                               1997                 :                :  * Locations of NOT subexpressions are not reported.  (Obviously, there can
                               1998                 :                :  * be no successful NOT matches at top level, or the match would have failed.
                               1999                 :                :  * So this amounts to ignoring NOTs underneath ORs.)
                               2000                 :                :  *
                               2001                 :                :  * The result is NIL if no match, or if position data was not returned.
                               2002                 :                :  *
                               2003                 :                :  * Arguments are the same as for TS_execute, although flags is currently
                               2004                 :                :  * vestigial since none of the defined bits are sensible here.
                               2005                 :                :  */
                               2006                 :                : List *
  451 tgl@sss.pgh.pa.us        2007                 :CBC         181 : TS_execute_locations(QueryItem *curitem, void *arg,
                               2008                 :                :                      uint32 flags,
                               2009                 :                :                      TSExecuteCallback chkcond)
                               2010                 :                : {
                               2011                 :                :     List       *result;
                               2012                 :                : 
                               2013                 :                :     /* No flags supported, as yet */
                               2014         [ -  + ]:            181 :     Assert(flags == TS_EXEC_EMPTY);
                               2015         [ +  + ]:            181 :     if (TS_execute_locations_recurse(curitem, arg, chkcond, &result))
                               2016                 :             64 :         return result;
                               2017                 :            117 :     return NIL;
                               2018                 :                : }
                               2019                 :                : 
                               2020                 :                : /*
                               2021                 :                :  * TS_execute_locations recursion for operators above any phrase operator.
                               2022                 :                :  * OP_PHRASE subexpressions can be passed off to TS_phrase_execute.
                               2023                 :                :  */
                               2024                 :                : static bool
                               2025                 :            535 : TS_execute_locations_recurse(QueryItem *curitem, void *arg,
                               2026                 :                :                              TSExecuteCallback chkcond,
                               2027                 :                :                              List **locations)
                               2028                 :                : {
                               2029                 :                :     bool        lmatch,
                               2030                 :                :                 rmatch;
                               2031                 :                :     List       *llocations,
                               2032                 :                :                *rlocations;
                               2033                 :                :     ExecPhraseData *data;
                               2034                 :                : 
                               2035                 :                :     /* since this function recurses, it could be driven to stack overflow */
                               2036                 :            535 :     check_stack_depth();
                               2037                 :                : 
                               2038                 :                :     /* ... and let's check for query cancel while we're at it */
                               2039         [ -  + ]:            535 :     CHECK_FOR_INTERRUPTS();
                               2040                 :                : 
                               2041                 :                :     /* Default locations result is empty */
                               2042                 :            535 :     *locations = NIL;
                               2043                 :                : 
                               2044         [ +  + ]:            535 :     if (curitem->type == QI_VAL)
                               2045                 :                :     {
                               2046                 :            223 :         data = palloc0_object(ExecPhraseData);
                               2047         [ +  + ]:            223 :         if (chkcond(arg, (QueryOperand *) curitem, data) == TS_YES)
                               2048                 :                :         {
                               2049                 :            106 :             *locations = list_make1(data);
                               2050                 :            106 :             return true;
                               2051                 :                :         }
                               2052                 :            117 :         pfree(data);
                               2053                 :            117 :         return false;
                               2054                 :                :     }
                               2055                 :                : 
                               2056   [ +  +  +  +  :            312 :     switch (curitem->qoperator.oper)
                                                 - ]
                               2057                 :                :     {
                               2058                 :              6 :         case OP_NOT:
                               2059         [ -  + ]:              6 :             if (!TS_execute_locations_recurse(curitem + 1, arg, chkcond,
                               2060                 :                :                                               &llocations))
  451 tgl@sss.pgh.pa.us        2061                 :UBC           0 :                 return true;    /* we don't pass back any locations */
  451 tgl@sss.pgh.pa.us        2062                 :CBC           6 :             return false;
                               2063                 :                : 
                               2064                 :            264 :         case OP_AND:
                               2065         [ +  + ]:            264 :             if (!TS_execute_locations_recurse(curitem + curitem->qoperator.left,
                               2066                 :                :                                               arg, chkcond,
                               2067                 :                :                                               &llocations))
                               2068                 :            204 :                 return false;
                               2069         [ +  + ]:             60 :             if (!TS_execute_locations_recurse(curitem + 1,
                               2070                 :                :                                               arg, chkcond,
                               2071                 :                :                                               &rlocations))
                               2072                 :             27 :                 return false;
                               2073                 :             33 :             *locations = list_concat(llocations, rlocations);
                               2074                 :             33 :             return true;
                               2075                 :                : 
                               2076                 :             12 :         case OP_OR:
                               2077                 :             12 :             lmatch = TS_execute_locations_recurse(curitem + curitem->qoperator.left,
                               2078                 :                :                                                   arg, chkcond,
                               2079                 :                :                                                   &llocations);
                               2080                 :             12 :             rmatch = TS_execute_locations_recurse(curitem + 1,
                               2081                 :                :                                                   arg, chkcond,
                               2082                 :                :                                                   &rlocations);
                               2083   [ -  +  -  - ]:             12 :             if (lmatch || rmatch)
                               2084                 :                :             {
                               2085                 :                :                 /*
                               2086                 :                :                  * We generate an AND'able location struct from each
                               2087                 :                :                  * combination of sub-matches, following the disjunctive law
                               2088                 :                :                  * (A & B) | (C & D) = (A | C) & (A | D) & (B | C) & (B | D).
                               2089                 :                :                  *
                               2090                 :                :                  * However, if either input didn't produce locations (i.e., it
                               2091                 :                :                  * failed or was a NOT), we must just return the other list.
                               2092                 :                :                  */
                               2093         [ -  + ]:             12 :                 if (llocations == NIL)
  451 tgl@sss.pgh.pa.us        2094                 :UBC           0 :                     *locations = rlocations;
  451 tgl@sss.pgh.pa.us        2095         [ +  + ]:CBC          12 :                 else if (rlocations == NIL)
                               2096                 :              6 :                     *locations = llocations;
                               2097                 :                :                 else
                               2098                 :                :                 {
                               2099                 :                :                     ListCell   *ll;
                               2100                 :                : 
                               2101   [ +  -  +  +  :             12 :                     foreach(ll, llocations)
                                              +  + ]
                               2102                 :                :                     {
                               2103                 :              6 :                         ExecPhraseData *ldata = (ExecPhraseData *) lfirst(ll);
                               2104                 :                :                         ListCell   *lr;
                               2105                 :                : 
                               2106   [ +  -  +  +  :             12 :                         foreach(lr, rlocations)
                                              +  + ]
                               2107                 :                :                         {
                               2108                 :              6 :                             ExecPhraseData *rdata = (ExecPhraseData *) lfirst(lr);
                               2109                 :                : 
                               2110                 :              6 :                             data = palloc0_object(ExecPhraseData);
                               2111                 :              6 :                             (void) TS_phrase_output(data, ldata, rdata,
                               2112                 :                :                                                     TSPO_BOTH | TSPO_L_ONLY | TSPO_R_ONLY,
                               2113                 :                :                                                     0, 0,
                               2114                 :              6 :                                                     ldata->npos + rdata->npos);
                               2115                 :                :                             /* Report the larger width, as explained above. */
                               2116                 :              6 :                             data->width = Max(ldata->width, rdata->width);
                               2117                 :              6 :                             *locations = lappend(*locations, data);
                               2118                 :                :                         }
                               2119                 :                :                     }
                               2120                 :                :                 }
                               2121                 :                : 
                               2122                 :             12 :                 return true;
                               2123                 :                :             }
  451 tgl@sss.pgh.pa.us        2124                 :UBC           0 :             return false;
                               2125                 :                : 
  451 tgl@sss.pgh.pa.us        2126                 :CBC          30 :         case OP_PHRASE:
                               2127                 :                :             /* We can hand this off to TS_phrase_execute */
                               2128                 :             30 :             data = palloc0_object(ExecPhraseData);
                               2129         [ +  - ]:             30 :             if (TS_phrase_execute(curitem, arg, TS_EXEC_EMPTY, chkcond,
                               2130                 :                :                                   data) == TS_YES)
                               2131                 :                :             {
                               2132         [ +  - ]:             30 :                 if (!data->negate)
                               2133                 :             30 :                     *locations = list_make1(data);
                               2134                 :             30 :                 return true;
                               2135                 :                :             }
  451 tgl@sss.pgh.pa.us        2136                 :UBC           0 :             pfree(data);
                               2137                 :              0 :             return false;
                               2138                 :                : 
                               2139                 :              0 :         default:
                               2140         [ #  # ]:              0 :             elog(ERROR, "unrecognized operator: %d", curitem->qoperator.oper);
                               2141                 :                :     }
                               2142                 :                : 
                               2143                 :                :     /* not reachable, but keep compiler quiet */
                               2144                 :                :     return false;
                               2145                 :                : }
                               2146                 :                : 
                               2147                 :                : /*
                               2148                 :                :  * Detect whether a tsquery boolean expression requires any positive matches
                               2149                 :                :  * to values shown in the tsquery.
                               2150                 :                :  *
                               2151                 :                :  * This is needed to know whether a GIN index search requires full index scan.
                               2152                 :                :  * For example, 'x & !y' requires a match of x, so it's sufficient to scan
                               2153                 :                :  * entries for x; but 'x | !y' could match rows containing neither x nor y.
                               2154                 :                :  */
                               2155                 :                : bool
 4844 tgl@sss.pgh.pa.us        2156                 :CBC         417 : tsquery_requires_match(QueryItem *curitem)
                               2157                 :                : {
                               2158                 :                :     /* since this function recurses, it could be driven to stack overflow */
                               2159                 :            417 :     check_stack_depth();
                               2160                 :                : 
                               2161         [ +  + ]:            417 :     if (curitem->type == QI_VAL)
                               2162                 :            198 :         return true;
                               2163                 :                : 
                               2164   [ +  +  +  - ]:            219 :     switch (curitem->qoperator.oper)
                               2165                 :                :     {
                               2166                 :             84 :         case OP_NOT:
                               2167                 :                : 
                               2168                 :                :             /*
                               2169                 :                :              * Assume there are no required matches underneath a NOT.  For
                               2170                 :                :              * some cases with nested NOTs, we could prove there's a required
                               2171                 :                :              * match, but it seems unlikely to be worth the trouble.
                               2172                 :                :              */
                               2173                 :             84 :             return false;
                               2174                 :                : 
 2929 teodor@sigaev.ru         2175                 :            102 :         case OP_PHRASE:
                               2176                 :                : 
                               2177                 :                :             /*
                               2178                 :                :              * Treat OP_PHRASE as OP_AND here
                               2179                 :                :              */
                               2180                 :                :         case OP_AND:
                               2181                 :                :             /* If either side requires a match, we're good */
 4844 tgl@sss.pgh.pa.us        2182         [ +  + ]:            102 :             if (tsquery_requires_match(curitem + curitem->qoperator.left))
                               2183                 :             78 :                 return true;
                               2184                 :                :             else
                               2185                 :             24 :                 return tsquery_requires_match(curitem + 1);
                               2186                 :                : 
                               2187                 :             33 :         case OP_OR:
                               2188                 :                :             /* Both sides must require a match */
                               2189         [ +  - ]:             33 :             if (tsquery_requires_match(curitem + curitem->qoperator.left))
                               2190                 :             33 :                 return tsquery_requires_match(curitem + 1);
                               2191                 :                :             else
 4844 tgl@sss.pgh.pa.us        2192                 :UBC           0 :                 return false;
                               2193                 :                : 
                               2194                 :              0 :         default:
                               2195         [ #  # ]:              0 :             elog(ERROR, "unrecognized operator: %d", curitem->qoperator.oper);
                               2196                 :                :     }
                               2197                 :                : 
                               2198                 :                :     /* not reachable, but keep compiler quiet */
                               2199                 :                :     return false;
                               2200                 :                : }
                               2201                 :                : 
                               2202                 :                : /*
                               2203                 :                :  * boolean operations
                               2204                 :                :  */
                               2205                 :                : Datum
 6081 tgl@sss.pgh.pa.us        2206                 :CBC          30 : ts_match_qv(PG_FUNCTION_ARGS)
                               2207                 :                : {
                               2208                 :             30 :     PG_RETURN_DATUM(DirectFunctionCall2(ts_match_vq,
                               2209                 :                :                                         PG_GETARG_DATUM(1),
                               2210                 :                :                                         PG_GETARG_DATUM(0)));
                               2211                 :                : }
                               2212                 :                : 
                               2213                 :                : Datum
                               2214                 :         110040 : ts_match_vq(PG_FUNCTION_ARGS)
                               2215                 :                : {
                               2216                 :         110040 :     TSVector    val = PG_GETARG_TSVECTOR(0);
                               2217                 :         110040 :     TSQuery     query = PG_GETARG_TSQUERY(1);
                               2218                 :                :     CHKVAL      chkval;
                               2219                 :                :     bool        result;
                               2220                 :                : 
                               2221                 :                :     /* empty query matches nothing */
 2635                          2222         [ -  + ]:         110040 :     if (!query->size)
                               2223                 :                :     {
 6081 tgl@sss.pgh.pa.us        2224         [ #  # ]:UBC           0 :         PG_FREE_IF_COPY(val, 0);
                               2225         [ #  # ]:              0 :         PG_FREE_IF_COPY(query, 1);
                               2226                 :              0 :         PG_RETURN_BOOL(false);
                               2227                 :                :     }
                               2228                 :                : 
 6081 tgl@sss.pgh.pa.us        2229                 :CBC      110040 :     chkval.arrb = ARRPTR(val);
                               2230                 :         110040 :     chkval.arre = chkval.arrb + val->size;
                               2231                 :         110040 :     chkval.values = STRPTR(val);
                               2232                 :         110040 :     chkval.operand = GETOPERAND(query);
 2676                          2233                 :         110040 :     result = TS_execute(GETQUERY(query),
                               2234                 :                :                         &chkval,
                               2235                 :                :                         TS_EXEC_EMPTY,
                               2236                 :                :                         checkcondition_str);
                               2237                 :                : 
 6081                          2238         [ +  + ]:         110040 :     PG_FREE_IF_COPY(val, 0);
                               2239         [ -  + ]:         110040 :     PG_FREE_IF_COPY(query, 1);
                               2240                 :         110040 :     PG_RETURN_BOOL(result);
                               2241                 :                : }
                               2242                 :                : 
                               2243                 :                : Datum
 6081 tgl@sss.pgh.pa.us        2244                 :UBC           0 : ts_match_tt(PG_FUNCTION_ARGS)
                               2245                 :                : {
                               2246                 :                :     TSVector    vector;
                               2247                 :                :     TSQuery     query;
                               2248                 :                :     bool        res;
                               2249                 :                : 
                               2250                 :              0 :     vector = DatumGetTSVector(DirectFunctionCall1(to_tsvector,
                               2251                 :                :                                                   PG_GETARG_DATUM(0)));
                               2252                 :              0 :     query = DatumGetTSQuery(DirectFunctionCall1(plainto_tsquery,
                               2253                 :                :                                                 PG_GETARG_DATUM(1)));
                               2254                 :                : 
                               2255                 :              0 :     res = DatumGetBool(DirectFunctionCall2(ts_match_vq,
                               2256                 :                :                                            TSVectorGetDatum(vector),
                               2257                 :                :                                            TSQueryGetDatum(query)));
                               2258                 :                : 
                               2259                 :              0 :     pfree(vector);
                               2260                 :              0 :     pfree(query);
                               2261                 :                : 
                               2262                 :              0 :     PG_RETURN_BOOL(res);
                               2263                 :                : }
                               2264                 :                : 
                               2265                 :                : Datum
                               2266                 :              0 : ts_match_tq(PG_FUNCTION_ARGS)
                               2267                 :                : {
                               2268                 :                :     TSVector    vector;
                               2269                 :              0 :     TSQuery     query = PG_GETARG_TSQUERY(1);
                               2270                 :                :     bool        res;
                               2271                 :                : 
                               2272                 :              0 :     vector = DatumGetTSVector(DirectFunctionCall1(to_tsvector,
                               2273                 :                :                                                   PG_GETARG_DATUM(0)));
                               2274                 :                : 
                               2275                 :              0 :     res = DatumGetBool(DirectFunctionCall2(ts_match_vq,
                               2276                 :                :                                            TSVectorGetDatum(vector),
                               2277                 :                :                                            TSQueryGetDatum(query)));
                               2278                 :                : 
                               2279                 :              0 :     pfree(vector);
                               2280         [ #  # ]:              0 :     PG_FREE_IF_COPY(query, 1);
                               2281                 :                : 
                               2282                 :              0 :     PG_RETURN_BOOL(res);
                               2283                 :                : }
                               2284                 :                : 
                               2285                 :                : /*
                               2286                 :                :  * ts_stat statistic function support
                               2287                 :                :  */
                               2288                 :                : 
                               2289                 :                : 
                               2290                 :                : /*
                               2291                 :                :  * Returns the number of positions in value 'wptr' within tsvector 'txt',
                               2292                 :                :  * that have a weight equal to one of the weights in 'weight' bitmask.
                               2293                 :                :  */
                               2294                 :                : static int
 5995 bruce@momjian.us         2295                 :CBC        4089 : check_weight(TSVector txt, WordEntry *wptr, int8 weight)
                               2296                 :                : {
 6081 tgl@sss.pgh.pa.us        2297         [ +  - ]:           4089 :     int         len = POSDATALEN(txt, wptr);
                               2298                 :           4089 :     int         num = 0;
                               2299                 :           4089 :     WordEntryPos *ptr = POSDATAPTR(txt, wptr);
                               2300                 :                : 
                               2301         [ +  + ]:           8325 :     while (len--)
                               2302                 :                :     {
                               2303         [ +  + ]:           4236 :         if (weight & (1 << WEP_GETWEIGHT(*ptr)))
                               2304                 :              6 :             num++;
                               2305                 :           4236 :         ptr++;
                               2306                 :                :     }
                               2307                 :           4089 :     return num;
                               2308                 :                : }
                               2309                 :                : 
                               2310                 :                : #define compareStatWord(a,e,t)                          \
                               2311                 :                :     tsCompareString((a)->lexeme, (a)->lenlexeme,      \
                               2312                 :                :                     STRPTR(t) + (e)->pos, (e)->len,       \
                               2313                 :                :                     false)
                               2314                 :                : 
                               2315                 :                : static void
 5627 teodor@sigaev.ru         2316                 :         172812 : insertStatEntry(MemoryContext persistentContext, TSVectorStat *stat, TSVector txt, uint32 off)
                               2317                 :                : {
 5421 bruce@momjian.us         2318                 :         172812 :     WordEntry  *we = ARRPTR(txt) + off;
                               2319                 :         172812 :     StatEntry  *node = stat->root,
                               2320                 :         172812 :                *pnode = NULL;
                               2321                 :                :     int         n,
 5625 teodor@sigaev.ru         2322                 :         172812 :                 res = 0;
 5421 bruce@momjian.us         2323                 :         172812 :     uint32      depth = 1;
                               2324                 :                : 
                               2325         [ +  + ]:         172812 :     if (stat->weight == 0)
 5627 teodor@sigaev.ru         2326         [ +  + ]:          86406 :         n = (we->haspos) ? POSDATALEN(txt, we) : 1;
                               2327                 :                :     else
                               2328         [ +  + ]:          86406 :         n = (we->haspos) ? check_weight(txt, we, stat->weight) : 0;
                               2329                 :                : 
 5421 bruce@momjian.us         2330         [ +  + ]:         172812 :     if (n == 0)
                               2331                 :          86403 :         return;                 /* nothing to insert */
                               2332                 :                : 
                               2333         [ +  + ]:         872697 :     while (node)
                               2334                 :                :     {
 5627 teodor@sigaev.ru         2335                 :         869265 :         res = compareStatWord(node, we, txt);
                               2336                 :                : 
                               2337         [ +  + ]:         869265 :         if (res == 0)
                               2338                 :                :         {
                               2339                 :          82977 :             break;
                               2340                 :                :         }
                               2341                 :                :         else
                               2342                 :                :         {
                               2343                 :         786288 :             pnode = node;
 5421 bruce@momjian.us         2344         [ +  + ]:         786288 :             node = (res < 0) ? node->left : node->right;
                               2345                 :                :         }
 5627 teodor@sigaev.ru         2346                 :         786288 :         depth++;
                               2347                 :                :     }
                               2348                 :                : 
                               2349         [ +  + ]:          86409 :     if (depth > stat->maxdepth)
                               2350                 :             63 :         stat->maxdepth = depth;
                               2351                 :                : 
                               2352         [ +  + ]:          86409 :     if (node == NULL)
                               2353                 :                :     {
 5421 bruce@momjian.us         2354                 :           3432 :         node = MemoryContextAlloc(persistentContext, STATENTRYHDRSZ + we->len);
 5627 teodor@sigaev.ru         2355                 :           3432 :         node->left = node->right = NULL;
                               2356                 :           3432 :         node->ndoc = 1;
                               2357                 :           3432 :         node->nentry = n;
                               2358                 :           3432 :         node->lenlexeme = we->len;
                               2359                 :           3432 :         memcpy(node->lexeme, STRPTR(txt) + we->pos, node->lenlexeme);
                               2360                 :                : 
 5421 bruce@momjian.us         2361         [ +  + ]:           3432 :         if (pnode == NULL)
                               2362                 :                :         {
 5627 teodor@sigaev.ru         2363                 :              6 :             stat->root = node;
                               2364                 :                :         }
                               2365                 :                :         else
                               2366                 :                :         {
                               2367         [ +  + ]:           3426 :             if (res < 0)
                               2368                 :           1690 :                 pnode->left = node;
                               2369                 :                :             else
                               2370                 :           1736 :                 pnode->right = node;
                               2371                 :                :         }
                               2372                 :                :     }
                               2373                 :                :     else
                               2374                 :                :     {
                               2375                 :          82977 :         node->ndoc++;
                               2376                 :          82977 :         node->nentry += n;
                               2377                 :                :     }
                               2378                 :                : }
                               2379                 :                : 
                               2380                 :                : static void
 5421 bruce@momjian.us         2381                 :         247692 : chooseNextStatEntry(MemoryContext persistentContext, TSVectorStat *stat, TSVector txt,
                               2382                 :                :                     uint32 low, uint32 high, uint32 offset)
                               2383                 :                : {
                               2384                 :                :     uint32      pos;
                               2385                 :         247692 :     uint32      middle = (low + high) >> 1;
                               2386                 :                : 
 5627 teodor@sigaev.ru         2387                 :         247692 :     pos = (low + middle) >> 1;
                               2388   [ +  +  +  +  :         247692 :     if (low != middle && pos >= offset && pos - offset < txt->size)
                                              +  + ]
 5421 bruce@momjian.us         2389                 :          85164 :         insertStatEntry(persistentContext, stat, txt, pos - offset);
 5627 teodor@sigaev.ru         2390                 :         247692 :     pos = (high + middle + 1) >> 1;
                               2391   [ +  +  +  +  :         247692 :     if (middle + 1 != high && pos >= offset && pos - offset < txt->size)
                                              +  + ]
 5421 bruce@momjian.us         2392                 :          84642 :         insertStatEntry(persistentContext, stat, txt, pos - offset);
                               2393                 :                : 
 5627 teodor@sigaev.ru         2394         [ +  + ]:         247692 :     if (low != middle)
                               2395                 :         123846 :         chooseNextStatEntry(persistentContext, stat, txt, low, middle, offset);
                               2396         [ +  + ]:         247692 :     if (high != middle + 1)
                               2397                 :         120840 :         chooseNextStatEntry(persistentContext, stat, txt, middle + 1, high, offset);
 6081 tgl@sss.pgh.pa.us        2398                 :         247692 : }
                               2399                 :                : 
                               2400                 :                : /*
                               2401                 :                :  * This is written like a custom aggregate function, because the
                               2402                 :                :  * original plan was to do just that. Unfortunately, an aggregate function
                               2403                 :                :  * can't return a set, so that plan was abandoned. If that limitation is
                               2404                 :                :  * lifted in the future, ts_stat could be a real aggregate function so that
                               2405                 :                :  * you could use it like this:
                               2406                 :                :  *
                               2407                 :                :  *   SELECT ts_stat(vector_column) FROM vector_table;
                               2408                 :                :  *
                               2409                 :                :  *  where vector_column is a tsvector-type column in vector_table.
                               2410                 :                :  */
                               2411                 :                : 
                               2412                 :                : static TSVectorStat *
 5627 teodor@sigaev.ru         2413                 :           3054 : ts_accum(MemoryContext persistentContext, TSVectorStat *stat, Datum data)
                               2414                 :                : {
 5421 bruce@momjian.us         2415                 :           3054 :     TSVector    txt = DatumGetTSVector(data);
                               2416                 :                :     uint32      i,
                               2417                 :           3054 :                 nbit = 0,
                               2418                 :                :                 offset;
                               2419                 :                : 
 6081 tgl@sss.pgh.pa.us        2420         [ -  + ]:           3054 :     if (stat == NULL)
                               2421                 :                :     {                           /* Init in first */
 5627 teodor@sigaev.ru         2422                 :UBC           0 :         stat = MemoryContextAllocZero(persistentContext, sizeof(TSVectorStat));
                               2423                 :              0 :         stat->maxdepth = 1;
                               2424                 :                :     }
                               2425                 :                : 
                               2426                 :                :     /* simple check of correctness */
 6081 tgl@sss.pgh.pa.us        2427   [ +  -  +  + ]:CBC        3054 :     if (txt == NULL || txt->size == 0)
                               2428                 :                :     {
 5627 teodor@sigaev.ru         2429   [ +  -  +  - ]:             48 :         if (txt && txt != (TSVector) DatumGetPointer(data))
 6081 tgl@sss.pgh.pa.us        2430                 :             48 :             pfree(txt);
                               2431                 :             48 :         return stat;
                               2432                 :                :     }
                               2433                 :                : 
 5627 teodor@sigaev.ru         2434                 :           3006 :     i = txt->size - 1;
                               2435         [ +  + ]:          21360 :     for (; i > 0; i >>= 1)
                               2436                 :          18354 :         nbit++;
                               2437                 :                : 
                               2438                 :           3006 :     nbit = 1 << nbit;
                               2439                 :           3006 :     offset = (nbit - txt->size) / 2;
                               2440                 :                : 
 5421 bruce@momjian.us         2441                 :           3006 :     insertStatEntry(persistentContext, stat, txt, (nbit >> 1) - offset);
 5627 teodor@sigaev.ru         2442                 :           3006 :     chooseNextStatEntry(persistentContext, stat, txt, 0, nbit, offset);
                               2443                 :                : 
                               2444                 :           3006 :     return stat;
                               2445                 :                : }
                               2446                 :                : 
                               2447                 :                : static void
 6081 tgl@sss.pgh.pa.us        2448                 :              6 : ts_setup_firstcall(FunctionCallInfo fcinfo, FuncCallContext *funcctx,
                               2449                 :                :                    TSVectorStat *stat)
                               2450                 :                : {
                               2451                 :                :     TupleDesc   tupdesc;
                               2452                 :                :     MemoryContext oldcontext;
                               2453                 :                :     StatEntry  *node;
                               2454                 :                : 
 5627 teodor@sigaev.ru         2455                 :              6 :     funcctx->user_fctx = (void *) stat;
                               2456                 :                : 
 6081 tgl@sss.pgh.pa.us        2457                 :              6 :     oldcontext = MemoryContextSwitchTo(funcctx->multi_call_memory_ctx);
                               2458                 :                : 
 5627 teodor@sigaev.ru         2459                 :              6 :     stat->stack = palloc0(sizeof(StatEntry *) * (stat->maxdepth + 1));
 5421 bruce@momjian.us         2460                 :              6 :     stat->stackpos = 0;
                               2461                 :                : 
 5627 teodor@sigaev.ru         2462                 :              6 :     node = stat->root;
                               2463                 :                :     /* find leftmost value */
 5297 tgl@sss.pgh.pa.us        2464         [ +  - ]:              6 :     if (node == NULL)
 5297 tgl@sss.pgh.pa.us        2465                 :UBC           0 :         stat->stack[stat->stackpos] = NULL;
                               2466                 :                :     else
                               2467                 :                :         for (;;)
                               2468                 :                :         {
 5297 tgl@sss.pgh.pa.us        2469                 :CBC          24 :             stat->stack[stat->stackpos] = node;
                               2470         [ +  + ]:             24 :             if (node->left)
                               2471                 :                :             {
                               2472                 :             18 :                 stat->stackpos++;
                               2473                 :             18 :                 node = node->left;
                               2474                 :                :             }
                               2475                 :                :             else
                               2476                 :              6 :                 break;
                               2477                 :                :         }
                               2478         [ -  + ]:              6 :     Assert(stat->stackpos <= stat->maxdepth);
                               2479                 :                : 
  480 michael@paquier.xyz      2480         [ -  + ]:              6 :     if (get_call_result_type(fcinfo, NULL, &tupdesc) != TYPEFUNC_COMPOSITE)
  480 michael@paquier.xyz      2481         [ #  # ]:UBC           0 :         elog(ERROR, "return type must be a row type");
  480 michael@paquier.xyz      2482                 :CBC           6 :     funcctx->tuple_desc = tupdesc;
 6081 tgl@sss.pgh.pa.us        2483                 :              6 :     funcctx->attinmeta = TupleDescGetAttInMetadata(tupdesc);
                               2484                 :                : 
                               2485                 :              6 :     MemoryContextSwitchTo(oldcontext);
                               2486                 :              6 : }
                               2487                 :                : 
                               2488                 :                : static StatEntry *
 5421 bruce@momjian.us         2489                 :           6864 : walkStatEntryTree(TSVectorStat *stat)
                               2490                 :                : {
                               2491                 :           6864 :     StatEntry  *node = stat->stack[stat->stackpos];
                               2492                 :                : 
                               2493         [ -  + ]:           6864 :     if (node == NULL)
 5627 teodor@sigaev.ru         2494                 :UBC           0 :         return NULL;
                               2495                 :                : 
 5421 bruce@momjian.us         2496         [ +  + ]:CBC        6864 :     if (node->ndoc != 0)
                               2497                 :                :     {
                               2498                 :                :         /* return entry itself: we already was at left sublink */
 5627 teodor@sigaev.ru         2499                 :           1696 :         return node;
                               2500                 :                :     }
                               2501   [ +  +  +  + ]:           5168 :     else if (node->right && node->right != stat->stack[stat->stackpos + 1])
                               2502                 :                :     {
                               2503                 :                :         /* go on right sublink */
                               2504                 :           1736 :         stat->stackpos++;
                               2505                 :           1736 :         node = node->right;
                               2506                 :                : 
                               2507                 :                :         /* find most-left value */
                               2508                 :                :         for (;;)
                               2509                 :                :         {
                               2510                 :           3408 :             stat->stack[stat->stackpos] = node;
                               2511         [ +  + ]:           3408 :             if (node->left)
                               2512                 :                :             {
                               2513                 :           1672 :                 stat->stackpos++;
                               2514                 :           1672 :                 node = node->left;
                               2515                 :                :             }
                               2516                 :                :             else
                               2517                 :           1736 :                 break;
                               2518                 :                :         }
 5297 tgl@sss.pgh.pa.us        2519         [ -  + ]:           1736 :         Assert(stat->stackpos <= stat->maxdepth);
                               2520                 :                :     }
                               2521                 :                :     else
                               2522                 :                :     {
                               2523                 :                :         /* we already return all left subtree, itself and  right subtree */
 5627 teodor@sigaev.ru         2524         [ +  + ]:           3432 :         if (stat->stackpos == 0)
                               2525                 :              6 :             return NULL;
                               2526                 :                : 
                               2527                 :           3426 :         stat->stackpos--;
                               2528                 :           3426 :         return walkStatEntryTree(stat);
                               2529                 :                :     }
                               2530                 :                : 
                               2531                 :           1736 :     return node;
                               2532                 :                : }
                               2533                 :                : 
                               2534                 :                : static Datum
 6081 tgl@sss.pgh.pa.us        2535                 :           3438 : ts_process_call(FuncCallContext *funcctx)
                               2536                 :                : {
                               2537                 :                :     TSVectorStat *st;
                               2538                 :                :     StatEntry  *entry;
                               2539                 :                : 
 5627 teodor@sigaev.ru         2540                 :           3438 :     st = (TSVectorStat *) funcctx->user_fctx;
                               2541                 :                : 
                               2542                 :           3438 :     entry = walkStatEntryTree(st);
                               2543                 :                : 
                               2544         [ +  + ]:           3438 :     if (entry != NULL)
                               2545                 :                :     {
                               2546                 :                :         Datum       result;
                               2547                 :                :         char       *values[3];
                               2548                 :                :         char        ndoc[16];
                               2549                 :                :         char        nentry[16];
                               2550                 :                :         HeapTuple   tuple;
                               2551                 :                : 
                               2552                 :           3432 :         values[0] = palloc(entry->lenlexeme + 1);
                               2553                 :           3432 :         memcpy(values[0], entry->lexeme, entry->lenlexeme);
                               2554                 :           3432 :         (values[0])[entry->lenlexeme] = '\0';
 6081 tgl@sss.pgh.pa.us        2555                 :           3432 :         sprintf(ndoc, "%d", entry->ndoc);
                               2556                 :           3432 :         values[1] = ndoc;
                               2557                 :           3432 :         sprintf(nentry, "%d", entry->nentry);
                               2558                 :           3432 :         values[2] = nentry;
                               2559                 :                : 
                               2560                 :           3432 :         tuple = BuildTupleFromCStrings(funcctx->attinmeta, values);
                               2561                 :           3432 :         result = HeapTupleGetDatum(tuple);
                               2562                 :                : 
                               2563                 :           3432 :         pfree(values[0]);
                               2564                 :                : 
                               2565                 :                :         /* mark entry as already visited */
 5627 teodor@sigaev.ru         2566                 :           3432 :         entry->ndoc = 0;
                               2567                 :                : 
 6081 tgl@sss.pgh.pa.us        2568                 :           3432 :         return result;
                               2569                 :                :     }
                               2570                 :                : 
                               2571                 :              6 :     return (Datum) 0;
                               2572                 :                : }
                               2573                 :                : 
                               2574                 :                : static TSVectorStat *
 5627 teodor@sigaev.ru         2575                 :              6 : ts_stat_sql(MemoryContext persistentContext, text *txt, text *ws)
                               2576                 :                : {
 5864 tgl@sss.pgh.pa.us        2577                 :              6 :     char       *query = text_to_cstring(txt);
                               2578                 :                :     TSVectorStat *stat;
                               2579                 :                :     bool        isnull;
                               2580                 :                :     Portal      portal;
                               2581                 :                :     SPIPlanPtr  plan;
                               2582                 :                : 
 6081                          2583         [ -  + ]:              6 :     if ((plan = SPI_prepare(query, 0, NULL)) == NULL)
                               2584                 :                :         /* internal error */
 6081 tgl@sss.pgh.pa.us        2585         [ #  # ]:UBC           0 :         elog(ERROR, "SPI_prepare(\"%s\") failed", query);
                               2586                 :                : 
 6017 tgl@sss.pgh.pa.us        2587         [ -  + ]:CBC           6 :     if ((portal = SPI_cursor_open(NULL, plan, NULL, NULL, true)) == NULL)
                               2588                 :                :         /* internal error */
 6081 tgl@sss.pgh.pa.us        2589         [ #  # ]:UBC           0 :         elog(ERROR, "SPI_cursor_open(\"%s\") failed", query);
                               2590                 :                : 
 6081 tgl@sss.pgh.pa.us        2591                 :CBC           6 :     SPI_cursor_fetch(portal, true, 100);
                               2592                 :                : 
 6017                          2593         [ +  - ]:              6 :     if (SPI_tuptable == NULL ||
                               2594         [ +  - ]:              6 :         SPI_tuptable->tupdesc->natts != 1 ||
 3132 teodor@sigaev.ru         2595         [ -  + ]:              6 :         !IsBinaryCoercible(SPI_gettypeid(SPI_tuptable->tupdesc, 1),
                               2596                 :                :                            TSVECTOROID))
 6081 tgl@sss.pgh.pa.us        2597         [ #  # ]:UBC           0 :         ereport(ERROR,
                               2598                 :                :                 (errcode(ERRCODE_INVALID_PARAMETER_VALUE),
                               2599                 :                :                  errmsg("ts_stat query must return one tsvector column")));
                               2600                 :                : 
 5627 teodor@sigaev.ru         2601                 :CBC           6 :     stat = MemoryContextAllocZero(persistentContext, sizeof(TSVectorStat));
                               2602                 :              6 :     stat->maxdepth = 1;
                               2603                 :                : 
 6081 tgl@sss.pgh.pa.us        2604         [ +  + ]:              6 :     if (ws)
                               2605                 :                :     {
                               2606                 :                :         char       *buf;
                               2607                 :                : 
 2590 noah@leadboat.com        2608         [ -  + ]:              3 :         buf = VARDATA_ANY(ws);
                               2609   [ -  +  -  +  :              9 :         while (buf - VARDATA_ANY(ws) < VARSIZE_ANY_EXHDR(ws))
                                     -  -  -  -  -  
                                        -  -  +  +  
                                                 + ]
                               2610                 :                :         {
 6081 tgl@sss.pgh.pa.us        2611         [ +  - ]:              6 :             if (pg_mblen(buf) == 1)
                               2612                 :                :             {
                               2613   [ +  +  -  -  :              6 :                 switch (*buf)
                                                 - ]
                               2614                 :                :                 {
                               2615                 :              3 :                     case 'A':
                               2616                 :                :                     case 'a':
                               2617                 :              3 :                         stat->weight |= 1 << 3;
                               2618                 :              3 :                         break;
                               2619                 :              3 :                     case 'B':
                               2620                 :                :                     case 'b':
                               2621                 :              3 :                         stat->weight |= 1 << 2;
                               2622                 :              3 :                         break;
 6081 tgl@sss.pgh.pa.us        2623                 :UBC           0 :                     case 'C':
                               2624                 :                :                     case 'c':
                               2625                 :              0 :                         stat->weight |= 1 << 1;
                               2626                 :              0 :                         break;
                               2627                 :              0 :                     case 'D':
                               2628                 :                :                     case 'd':
                               2629                 :              0 :                         stat->weight |= 1;
                               2630                 :              0 :                         break;
                               2631                 :              0 :                     default:
                               2632                 :              0 :                         stat->weight |= 0;
                               2633                 :                :                 }
                               2634                 :                :             }
 6081 tgl@sss.pgh.pa.us        2635                 :CBC           6 :             buf += pg_mblen(buf);
                               2636                 :                :         }
                               2637                 :                :     }
                               2638                 :                : 
                               2639         [ +  + ]:             42 :     while (SPI_processed > 0)
                               2640                 :                :     {
                               2641                 :                :         uint64      i;
                               2642                 :                : 
                               2643         [ +  + ]:           3090 :         for (i = 0; i < SPI_processed; i++)
                               2644                 :                :         {
                               2645                 :           3054 :             Datum       data = SPI_getbinval(SPI_tuptable->vals[i], SPI_tuptable->tupdesc, 1, &isnull);
                               2646                 :                : 
                               2647         [ +  - ]:           3054 :             if (!isnull)
 5627 teodor@sigaev.ru         2648                 :           3054 :                 stat = ts_accum(persistentContext, stat, data);
                               2649                 :                :         }
                               2650                 :                : 
 6081 tgl@sss.pgh.pa.us        2651                 :             36 :         SPI_freetuptable(SPI_tuptable);
                               2652                 :             36 :         SPI_cursor_fetch(portal, true, 100);
                               2653                 :                :     }
                               2654                 :                : 
                               2655                 :              6 :     SPI_freetuptable(SPI_tuptable);
                               2656                 :              6 :     SPI_cursor_close(portal);
                               2657                 :              6 :     SPI_freeplan(plan);
                               2658                 :              6 :     pfree(query);
                               2659                 :                : 
                               2660                 :              6 :     return stat;
                               2661                 :                : }
                               2662                 :                : 
                               2663                 :                : Datum
                               2664                 :           3432 : ts_stat1(PG_FUNCTION_ARGS)
                               2665                 :                : {
                               2666                 :                :     FuncCallContext *funcctx;
                               2667                 :                :     Datum       result;
                               2668                 :                : 
                               2669         [ +  + ]:           3432 :     if (SRF_IS_FIRSTCALL())
                               2670                 :                :     {
                               2671                 :                :         TSVectorStat *stat;
 2590 noah@leadboat.com        2672                 :              3 :         text       *txt = PG_GETARG_TEXT_PP(0);
                               2673                 :                : 
 6081 tgl@sss.pgh.pa.us        2674                 :              3 :         funcctx = SRF_FIRSTCALL_INIT();
                               2675                 :              3 :         SPI_connect();
 5627 teodor@sigaev.ru         2676                 :              3 :         stat = ts_stat_sql(funcctx->multi_call_memory_ctx, txt, NULL);
 6081 tgl@sss.pgh.pa.us        2677         [ -  + ]:              3 :         PG_FREE_IF_COPY(txt, 0);
                               2678                 :              3 :         ts_setup_firstcall(fcinfo, funcctx, stat);
                               2679                 :              3 :         SPI_finish();
                               2680                 :                :     }
                               2681                 :                : 
                               2682                 :           3432 :     funcctx = SRF_PERCALL_SETUP();
                               2683         [ +  + ]:           3432 :     if ((result = ts_process_call(funcctx)) != (Datum) 0)
                               2684                 :           3429 :         SRF_RETURN_NEXT(funcctx, result);
                               2685                 :              3 :     SRF_RETURN_DONE(funcctx);
                               2686                 :                : }
                               2687                 :                : 
                               2688                 :                : Datum
                               2689                 :              6 : ts_stat2(PG_FUNCTION_ARGS)
                               2690                 :                : {
                               2691                 :                :     FuncCallContext *funcctx;
                               2692                 :                :     Datum       result;
                               2693                 :                : 
                               2694         [ +  + ]:              6 :     if (SRF_IS_FIRSTCALL())
                               2695                 :                :     {
                               2696                 :                :         TSVectorStat *stat;
 2590 noah@leadboat.com        2697                 :              3 :         text       *txt = PG_GETARG_TEXT_PP(0);
                               2698                 :              3 :         text       *ws = PG_GETARG_TEXT_PP(1);
                               2699                 :                : 
 6081 tgl@sss.pgh.pa.us        2700                 :              3 :         funcctx = SRF_FIRSTCALL_INIT();
                               2701                 :              3 :         SPI_connect();
 5627 teodor@sigaev.ru         2702                 :              3 :         stat = ts_stat_sql(funcctx->multi_call_memory_ctx, txt, ws);
 6081 tgl@sss.pgh.pa.us        2703         [ -  + ]:              3 :         PG_FREE_IF_COPY(txt, 0);
                               2704         [ -  + ]:              3 :         PG_FREE_IF_COPY(ws, 1);
                               2705                 :              3 :         ts_setup_firstcall(fcinfo, funcctx, stat);
                               2706                 :              3 :         SPI_finish();
                               2707                 :                :     }
                               2708                 :                : 
                               2709                 :              6 :     funcctx = SRF_PERCALL_SETUP();
                               2710         [ +  + ]:              6 :     if ((result = ts_process_call(funcctx)) != (Datum) 0)
                               2711                 :              3 :         SRF_RETURN_NEXT(funcctx, result);
                               2712                 :              3 :     SRF_RETURN_DONE(funcctx);
                               2713                 :                : }
                               2714                 :                : 
                               2715                 :                : 
                               2716                 :                : /*
                               2717                 :                :  * Triggers for automatic update of a tsvector column from text column(s)
                               2718                 :                :  *
                               2719                 :                :  * Trigger arguments are either
                               2720                 :                :  *      name of tsvector col, name of tsconfig to use, name(s) of text col(s)
                               2721                 :                :  *      name of tsvector col, name of regconfig col, name(s) of text col(s)
                               2722                 :                :  * ie, tsconfig can either be specified by name, or indirectly as the
                               2723                 :                :  * contents of a regconfig field in the row.  If the name is used, it must
                               2724                 :                :  * be explicitly schema-qualified.
                               2725                 :                :  */
                               2726                 :                : Datum
                               2727                 :              9 : tsvector_update_trigger_byid(PG_FUNCTION_ARGS)
                               2728                 :                : {
                               2729                 :              9 :     return tsvector_update_trigger(fcinfo, false);
                               2730                 :                : }
                               2731                 :                : 
                               2732                 :                : Datum
 6081 tgl@sss.pgh.pa.us        2733                 :UBC           0 : tsvector_update_trigger_bycolumn(PG_FUNCTION_ARGS)
                               2734                 :                : {
                               2735                 :              0 :     return tsvector_update_trigger(fcinfo, true);
                               2736                 :                : }
                               2737                 :                : 
                               2738                 :                : static Datum
 6081 tgl@sss.pgh.pa.us        2739                 :CBC           9 : tsvector_update_trigger(PG_FUNCTION_ARGS, bool config_column)
                               2740                 :                : {
                               2741                 :                :     TriggerData *trigdata;
                               2742                 :                :     Trigger    *trigger;
                               2743                 :                :     Relation    rel;
                               2744                 :              9 :     HeapTuple   rettuple = NULL;
                               2745                 :                :     int         tsvector_attr_num,
                               2746                 :                :                 i;
                               2747                 :                :     ParsedText  prs;
                               2748                 :                :     Datum       datum;
                               2749                 :                :     bool        isnull;
                               2750                 :                :     text       *txt;
                               2751                 :                :     Oid         cfgId;
                               2752                 :                :     bool        update_needed;
                               2753                 :                : 
                               2754                 :                :     /* Check call context */
 2489                          2755   [ +  -  -  + ]:              9 :     if (!CALLED_AS_TRIGGER(fcinfo)) /* internal error */
 6081 tgl@sss.pgh.pa.us        2756         [ #  # ]:UBC           0 :         elog(ERROR, "tsvector_update_trigger: not fired by trigger manager");
                               2757                 :                : 
 6081 tgl@sss.pgh.pa.us        2758                 :CBC           9 :     trigdata = (TriggerData *) fcinfo->context;
 4937                          2759         [ -  + ]:              9 :     if (!TRIGGER_FIRED_FOR_ROW(trigdata->tg_event))
 4937 tgl@sss.pgh.pa.us        2760         [ #  # ]:UBC           0 :         elog(ERROR, "tsvector_update_trigger: must be fired for row");
 4937 tgl@sss.pgh.pa.us        2761         [ -  + ]:CBC           9 :     if (!TRIGGER_FIRED_BEFORE(trigdata->tg_event))
 6081 tgl@sss.pgh.pa.us        2762         [ #  # ]:UBC           0 :         elog(ERROR, "tsvector_update_trigger: must be fired BEFORE event");
                               2763                 :                : 
 6081 tgl@sss.pgh.pa.us        2764         [ +  + ]:CBC           9 :     if (TRIGGER_FIRED_BY_INSERT(trigdata->tg_event))
                               2765                 :                :     {
                               2766                 :              6 :         rettuple = trigdata->tg_trigtuple;
 1497 peter@eisentraut.org     2767                 :              6 :         update_needed = true;
                               2768                 :                :     }
 6081 tgl@sss.pgh.pa.us        2769         [ +  - ]:              3 :     else if (TRIGGER_FIRED_BY_UPDATE(trigdata->tg_event))
                               2770                 :                :     {
                               2771                 :              3 :         rettuple = trigdata->tg_newtuple;
 1497 peter@eisentraut.org     2772                 :              3 :         update_needed = false;  /* computed below */
                               2773                 :                :     }
                               2774                 :                :     else
 6081 tgl@sss.pgh.pa.us        2775         [ #  # ]:UBC           0 :         elog(ERROR, "tsvector_update_trigger: must be fired for INSERT or UPDATE");
                               2776                 :                : 
 6081 tgl@sss.pgh.pa.us        2777                 :CBC           9 :     trigger = trigdata->tg_trigger;
                               2778                 :              9 :     rel = trigdata->tg_relation;
                               2779                 :                : 
                               2780         [ -  + ]:              9 :     if (trigger->tgnargs < 3)
 6081 tgl@sss.pgh.pa.us        2781         [ #  # ]:UBC           0 :         elog(ERROR, "tsvector_update_trigger: arguments must be tsvector_field, ts_config, text_field1, ...)");
                               2782                 :                : 
                               2783                 :                :     /* Find the target tsvector column */
 6081 tgl@sss.pgh.pa.us        2784                 :CBC           9 :     tsvector_attr_num = SPI_fnumber(rel->rd_att, trigger->tgargs[0]);
                               2785         [ -  + ]:              9 :     if (tsvector_attr_num == SPI_ERROR_NOATTRIBUTE)
 6081 tgl@sss.pgh.pa.us        2786         [ #  # ]:UBC           0 :         ereport(ERROR,
                               2787                 :                :                 (errcode(ERRCODE_UNDEFINED_COLUMN),
                               2788                 :                :                  errmsg("tsvector column \"%s\" does not exist",
                               2789                 :                :                         trigger->tgargs[0])));
                               2790                 :                :     /* This will effectively reject system columns, so no separate test: */
 3132 teodor@sigaev.ru         2791         [ -  + ]:CBC           9 :     if (!IsBinaryCoercible(SPI_gettypeid(rel->rd_att, tsvector_attr_num),
                               2792                 :                :                            TSVECTOROID))
 6081 tgl@sss.pgh.pa.us        2793         [ #  # ]:UBC           0 :         ereport(ERROR,
                               2794                 :                :                 (errcode(ERRCODE_DATATYPE_MISMATCH),
                               2795                 :                :                  errmsg("column \"%s\" is not of tsvector type",
                               2796                 :                :                         trigger->tgargs[0])));
                               2797                 :                : 
                               2798                 :                :     /* Find the configuration to use */
 6081 tgl@sss.pgh.pa.us        2799         [ -  + ]:CBC           9 :     if (config_column)
                               2800                 :                :     {
                               2801                 :                :         int         config_attr_num;
                               2802                 :                : 
 6081 tgl@sss.pgh.pa.us        2803                 :UBC           0 :         config_attr_num = SPI_fnumber(rel->rd_att, trigger->tgargs[1]);
                               2804         [ #  # ]:              0 :         if (config_attr_num == SPI_ERROR_NOATTRIBUTE)
                               2805         [ #  # ]:              0 :             ereport(ERROR,
                               2806                 :                :                     (errcode(ERRCODE_UNDEFINED_COLUMN),
                               2807                 :                :                      errmsg("configuration column \"%s\" does not exist",
                               2808                 :                :                             trigger->tgargs[1])));
 3132 teodor@sigaev.ru         2809         [ #  # ]:              0 :         if (!IsBinaryCoercible(SPI_gettypeid(rel->rd_att, config_attr_num),
                               2810                 :                :                                REGCONFIGOID))
 6081 tgl@sss.pgh.pa.us        2811         [ #  # ]:              0 :             ereport(ERROR,
                               2812                 :                :                     (errcode(ERRCODE_DATATYPE_MISMATCH),
                               2813                 :                :                      errmsg("column \"%s\" is not of regconfig type",
                               2814                 :                :                             trigger->tgargs[1])));
                               2815                 :                : 
                               2816                 :              0 :         datum = SPI_getbinval(rettuple, rel->rd_att, config_attr_num, &isnull);
                               2817         [ #  # ]:              0 :         if (isnull)
                               2818         [ #  # ]:              0 :             ereport(ERROR,
                               2819                 :                :                     (errcode(ERRCODE_NULL_VALUE_NOT_ALLOWED),
                               2820                 :                :                      errmsg("configuration column \"%s\" must not be null",
                               2821                 :                :                             trigger->tgargs[1])));
                               2822                 :              0 :         cfgId = DatumGetObjectId(datum);
                               2823                 :                :     }
                               2824                 :                :     else
                               2825                 :                :     {
                               2826                 :                :         List       *names;
                               2827                 :                : 
  474 tgl@sss.pgh.pa.us        2828                 :CBC           9 :         names = stringToQualifiedNameList(trigger->tgargs[1], NULL);
                               2829                 :                :         /* require a schema so that results are not search path dependent */
 6081                          2830         [ -  + ]:              9 :         if (list_length(names) < 2)
 6081 tgl@sss.pgh.pa.us        2831         [ #  # ]:UBC           0 :             ereport(ERROR,
                               2832                 :                :                     (errcode(ERRCODE_INVALID_PARAMETER_VALUE),
                               2833                 :                :                      errmsg("text search configuration name \"%s\" must be schema-qualified",
                               2834                 :                :                             trigger->tgargs[1])));
 5001 rhaas@postgresql.org     2835                 :CBC           9 :         cfgId = get_ts_config_oid(names, false);
                               2836                 :                :     }
                               2837                 :                : 
                               2838                 :                :     /* initialize parse state */
 6081 tgl@sss.pgh.pa.us        2839                 :              9 :     prs.lenwords = 32;
                               2840                 :              9 :     prs.curwords = 0;
                               2841                 :              9 :     prs.pos = 0;
                               2842                 :              9 :     prs.words = (ParsedWord *) palloc(sizeof(ParsedWord) * prs.lenwords);
                               2843                 :                : 
                               2844                 :                :     /* find all words in indexable column(s) */
                               2845         [ +  + ]:             18 :     for (i = 2; i < trigger->tgnargs; i++)
                               2846                 :                :     {
                               2847                 :                :         int         numattr;
                               2848                 :                : 
                               2849                 :              9 :         numattr = SPI_fnumber(rel->rd_att, trigger->tgargs[i]);
                               2850         [ -  + ]:              9 :         if (numattr == SPI_ERROR_NOATTRIBUTE)
 6081 tgl@sss.pgh.pa.us        2851         [ #  # ]:UBC           0 :             ereport(ERROR,
                               2852                 :                :                     (errcode(ERRCODE_UNDEFINED_COLUMN),
                               2853                 :                :                      errmsg("column \"%s\" does not exist",
                               2854                 :                :                             trigger->tgargs[i])));
 3132 teodor@sigaev.ru         2855         [ -  + ]:CBC           9 :         if (!IsBinaryCoercible(SPI_gettypeid(rel->rd_att, numattr), TEXTOID))
 6081 tgl@sss.pgh.pa.us        2856         [ #  # ]:UBC           0 :             ereport(ERROR,
                               2857                 :                :                     (errcode(ERRCODE_DATATYPE_MISMATCH),
                               2858                 :                :                      errmsg("column \"%s\" is not of a character type",
                               2859                 :                :                             trigger->tgargs[i])));
                               2860                 :                : 
 1497 peter@eisentraut.org     2861         [ +  + ]:CBC           9 :         if (bms_is_member(numattr - FirstLowInvalidHeapAttributeNumber, trigdata->tg_updatedcols))
                               2862                 :              3 :             update_needed = true;
                               2863                 :                : 
 6081 tgl@sss.pgh.pa.us        2864                 :              9 :         datum = SPI_getbinval(rettuple, rel->rd_att, numattr, &isnull);
                               2865         [ +  + ]:              9 :         if (isnull)
                               2866                 :              3 :             continue;
                               2867                 :                : 
 2590 noah@leadboat.com        2868                 :              6 :         txt = DatumGetTextPP(datum);
                               2869                 :                : 
                               2870   [ -  +  -  -  :              6 :         parsetext(cfgId, &prs, VARDATA_ANY(txt), VARSIZE_ANY_EXHDR(txt));
                                     -  -  -  -  +  
                                           -  +  - ]
                               2871                 :                : 
 6081 tgl@sss.pgh.pa.us        2872         [ -  + ]:              6 :         if (txt != (text *) DatumGetPointer(datum))
 6081 tgl@sss.pgh.pa.us        2873                 :UBC           0 :             pfree(txt);
                               2874                 :                :     }
                               2875                 :                : 
 1497 peter@eisentraut.org     2876         [ +  - ]:CBC           9 :     if (update_needed)
                               2877                 :                :     {
                               2878                 :                :         /* make tsvector value */
                               2879                 :              9 :         datum = TSVectorGetDatum(make_tsvector(&prs));
                               2880                 :              9 :         isnull = false;
                               2881                 :                : 
                               2882                 :                :         /* and insert it into tuple */
                               2883                 :              9 :         rettuple = heap_modify_tuple_by_cols(rettuple, rel->rd_att,
                               2884                 :                :                                              1, &tsvector_attr_num,
                               2885                 :                :                                              &datum, &isnull);
                               2886                 :                : 
                               2887                 :              9 :         pfree(DatumGetPointer(datum));
                               2888                 :                :     }
                               2889                 :                : 
 6081 tgl@sss.pgh.pa.us        2890                 :              9 :     return PointerGetDatum(rettuple);
                               2891                 :                : }
        

Generated by: LCOV version 2.1-beta2-3-g6141622